EP2188742A1 - Erfassung von zusammenhängen zwischen informationen repräsentierenden daten - Google Patents

Erfassung von zusammenhängen zwischen informationen repräsentierenden daten

Info

Publication number
EP2188742A1
EP2188742A1 EP07802081A EP07802081A EP2188742A1 EP 2188742 A1 EP2188742 A1 EP 2188742A1 EP 07802081 A EP07802081 A EP 07802081A EP 07802081 A EP07802081 A EP 07802081A EP 2188742 A1 EP2188742 A1 EP 2188742A1
Authority
EP
European Patent Office
Prior art keywords
context
request
data
information
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP07802081A
Other languages
English (en)
French (fr)
Inventor
Jörg Wurzer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iqser IP GmbH
Original Assignee
Iqser IP AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iqser IP AG filed Critical Iqser IP AG
Publication of EP2188742A1 publication Critical patent/EP2188742A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the present invention relates to a method for detecting at least one relationship between at least one at least one information representing date of at least one database and at least one at least one information representing date of a request for a context (context request) with the at least one at least one information representing date of at least one database
  • the at least one connection itself as a date representing at least one information in a dataset dynamically as a link between at least one at least one information representing date of at least one dataset and at least one another date of at least one dataset representing at least one information and / or or at least an electronic use of at least one information representing date of at least one data record is detected and reproduced by an optical and / or acoustic display device of the data processing system, the link by at least one syntactic comparison and / or by at least one semantic comparison of the at least one at least one information representing date of at least one database with the at least one at least one information representing date of the request for a context (context request) is generated with the at least one at least one information representing date of at least one database
  • the present invention relates to a data processing system with information representing data in at least one accessible via at least one data source database, which is designed and / or set up to execute a method according to the invention at least partially.
  • the subject of the present invention is furthermore a data processing device for the electronic processing of data, comprising a control and / or arithmetic unit, an input unit and an output unit, which is designed and / or configured to carry out a method according to the invention at least partially, preferably using at least one part a data processing system according to the invention.
  • Methods, data processing systems and / or data processing devices of the type mentioned above are used in the context of search applications or routines, for example by operating systems and / or by so-called search engines, as well as in the context of the organization, provision and / or delivery of information.
  • contents are processed as information representing data of a database by machine, in particular to be made available to users as a technical tool for solving tasks and / or serve.
  • data stocks are simple, universally usable, persistent data objects which in particular, such as files and / or documents in operating systems or databases, contain structure, content and, as required, management information.
  • the databases are a data processing system and / or a
  • Data processing device usually via at least one data source, usually a present in a data processing system or connectable via a communication network or connectable data carrier, such as a hard disk or the like data recording means accessible.
  • Operating systems work with a hierarchical order of files, for example in their so-called file system.
  • the files are classified as data in a tree structure in directories.
  • the files are usually navigated along an Aristotelian logic via the names of the individual directories up to a file.
  • the navigation may include several steps and also includes the problem of a unique assignment.
  • the management of files is separated from the management of data accessible only through application programs accessing databases or file-based data structures, such as XML. Usually, the separation takes place in accordance with the technical implementation or realization of the persistence of the respective data.
  • Database-driven applications have used relational databases to manage static links to data-driven tables. Due to the static links used in the tables managed by search engines, changes in the databases are not or only limited and delayed detectable. The evaluation or use of the data must be determined in advance.
  • Search engines usually allow users to search only for databases by keyword or a Boolean combination of keywords. Precise search queries such as the call of invoices or the like from a certain period of time or similar queries are not possible.
  • data processing systems usually work with a static - that is, firmly predetermined - hierarchically structured menu structure which provides the user with a selection of possible functions for operating the data processing system.
  • operating systems for example, MacOS X Apple, also called context menus are used.
  • These are also hierarchically structured menu structures, which, however, depending on the installed application programs are at least partially supplemented by corresponding menu items for starting or calling individual application programs and / or functionalities thereof. Apart from the suppleness of the menu structures, they are nevertheless statically hierarchically structured in their use.
  • the statically hierarchical structuring of menu structures which has hitherto been given in particular in data processing systems, can thus not or only partially comply with users' usage preferences.
  • the synchronization of information representing data in databases between different data processing devices sharing the databases is an important component of data processing systems, for example in the form of so-called PIM, especially in view of the increasing use of mobile data processing devices such as PDAs (Personal Digital Assistant) - Systems (PIM: Personal Information Management) integrated into data processing systems.
  • PIM Personal Digital Assistant
  • a user can, for example by manual input only select which or which part of his part of the data processing system managed by the contact addresses he wants to synchronize.
  • a closer or more detailed specification with regard to a content restriction of the information to be synchronized is not possible, in particular not as an automated process that adapts itself to the needs of the user.
  • the present invention has the object to improve the detection of relationships between information representing data, avoiding the disadvantages described, in particular with regard to the manner, extent and handling of the detection of contexts and the use of the detected relationships , in particular taking into account the respective user-specific use of the relationships.
  • the technical solution is with the present invention, a method for detecting at least one relationship between at least one at least one information representing date of at least one database and at least one at least one information representing date of a request for a context (context request) with the at least one at least one information representing Date of at least one database on the part of a data processing system with data representing information in at least one accessible via at least one data source, the at least one context itself as a date representing at least one information in a database dynamically as a link between at least one at least one information representing date at least one Dataset and at least one further at least one information representing date at least a dataset and / or at least one electronic use of at least one an information-representing date of at least one dataset is detected and reproduced by an optical and / or acoustic display device of the data processing system, wherein the link by at least one syntactic comparison and / or by at least one semantic comparison of the at least one at least one information representing date of at least one database with the at least one data requesting date of the request
  • such a context search is realized, whereby only such contents are taken into account in the context of the request for a connection (context request), which are related to a particular content.
  • the context search according to the invention thus makes it possible to find results of context requests with context dependency. A search is thus much more context-dependent.
  • a particularly preferred embodiment of the invention provides that the connection request takes place as a request to a search engine.
  • a search engine in the sense of the present invention is in particular a program for the search of documents and / or data records - which in the sense of the present invention is a date of a data record representing at least one information item - called by a computer - also computer or computer - or in be provided or kept available via a computer network, in particular the Internet or an intranet.
  • the context request for or with a search engine is advantageously a keyword index for the document base - which in the context of the present invention is a result of a query or context request - created to search queries on keywords - in the context of the present invention
  • At least one date of the relationship request representing information must be answered with a list of hits arranged according to relevance.
  • an information-representing date of the relationship request is - via the search engine, a list of references to possibly relevant documents or data records - which in the context of the present invention is at least one information-representative date of a data stock - delivered.
  • the requests for a connection between the contents of information representing data, context requests within the meaning of the present invention, are advantageously themselves information representing information and / or actions. Accordingly, according to the invention, connections between two consecutive contents are advantageously recorded as information representing data of one or two databases and, according to the invention, their context is taken into account.
  • the invention is based on the finding that, by taking into account or integrating the context from or between content, context requests can be further improved and optimized, in particular with regard to the usability for users of a context recording according to the invention.
  • a self-learning solution is realized.
  • the collection of correlations between information representing information is thus improved overall, in particular with regard to the manner, extent and handling of the capture of relationships as well as the use of the detected relationships.
  • relationships can be managed as knowledge.
  • the knowledge is converted by the process control according to the invention that knowledge is created by the combination of content.
  • the invention provides a self-learning solution that addresses itself to the needs and Preferences of the respective user or user. Accordingly, the functionalities of the inventive method can be easily and easily integrated into existing solutions, in particular data processing systems and / or data processing devices. Elaborate and training-intensive introductions of a solution according to the invention in existing or new projects can be omitted.
  • the solution according to the invention enables a user to come quickly and easily from one content to another content linked via contexts. Since advantageously all content can be repeatedly linked via relationships, in particular in groupings according to the invention, navigation in the context of a context request can advantageously also be traced back to the starting point of the request, that is to the context request itself.
  • the user can thus advantageously recognize contexts of meaning, in particular to or between his uses that are relevant, for example, to his current focus of interest. This is not possible in a fixed, static, hierarchical order of data processing systems, as is the case, for example, with operating systems that are generally used for selecting content and their application programs, since these do not leave any consideration to new order structures.
  • the solution according to the invention advantageously makes it possible to describe data according to a current requirement of the user.
  • the description of an address or a project by the inventive dynamic data management and the design of a corresponding graphical user interface with respect to the user handling for users extremely flexible and individual, especially since the description of an address or a project is not fixed as usual, rigid.
  • the specifiable information is used together with a detected context as an information representing date of a request for a context (context request).
  • a user can thus simply enter the specifiable information together with a content from an already previously recorded result of a context request and transfer it to the process implementing the process.
  • a request for a connection first a request for a connection (context request) with the at least one specifiable information as the at least one information representing date of a request for a connection (Contextual request), then a request for a Context (context request) with the at least one result of the request for a context (context request) with the at least one specifiable information as the at least one at least one information representing date of a request for a context (context request) as the at least one at least one information representing date Request for a connection (context request) takes place and finally the at least one result of the request for a connection (context request) with the at least one result of the request for a context (context request) with the at least one predetermined information as the at least one at least one information representing date a request for a context (context request) as the at least one at least one information representing date of a request for a context (context request) (context
  • a further advantageous embodiment of the invention is characterized in that the specifiable information is a sequence of letters and special characters which can be selected by a user and / or an application (search string).
  • a further particularly advantageous embodiment of the invention is characterized in that in the context of a request for a connection (context request) between the data representing at least one information of a request for a connection (context request) automatically a set of statements in terms of subject predicate object Relationships are generated so that natural language requests for a context (connectivity requests) can be made.
  • a connection request with an implicit ontology can be realized.
  • At least one word of a list (word list) created from a full text of words contained in the full text is used as the at least one date of the request for a context (context request) representing at least one information.
  • An advantageous embodiment of the invention provides that the words in the list (word list) of words contained in the full text are sorted in ascending order according to the frequency of their presence in the full text and the sorted words taking into account the frequency of their presence in the full text as the at least one information representing date of the request for a context (context request) are used.
  • a predeterminable number of the words sorted by the frequency of their presence in the full text are recorded in a list (sorted word list) and the words of the list (sorted word list) as the at least one information representing at least one Date of request for a context (interrelation request) can be used.
  • the list (sorted word list) contains the words with the least frequency of their presence in the full text.
  • the words are advantageously sorted according to the frequency of their presence in the full text.
  • the predeterminable number is preferably limited to 32, in particular since the number of usable for a connection request, preferably logically interlinkable attributes can be defined by the predetermined number and beyond as - empirically determined - the performance of the inventive solution in use can be optimized by data processing systems.
  • the words of the list are at least partially, preferably completely - that is the entire word list - used in parallel as the at least one at least one information representing date of the request for a context (context request).
  • the words of the sorted word list are logically linked to one another, preferably with a Boolean OR link, and the link is used as the at least one data representing date of the request for a connection (context request).
  • the context request preferably provides a similarity value via a search engine.
  • the similarity value is advantageously a percentage based on the similarity, with all the words used for the request as attributes from the sorted word list in the requested context, particularly preferably between two full texts or full text documents, occurring and / or relevant are and with a similarity value of 0% none of the words used for the query as attributes from the sorted word list in the requested context, particularly preferably between two full texts or full text documents, occurs and / or is similar or relevant in terms of similarity.
  • An alternative and / or supplementary embodiment of the invention advantageously provides that the words in the list are used in sequence as the at least one date of the request for a connection (context request) representing at least one information item.
  • the links are detected as and preferably with the dynamically detected relationships.
  • relational databases in which links are provided by tables provided with data, connections of the detected relationships are dynamically created in the solution according to the invention, preferably in n-to-n relationships, the relationships according to the method advantageously independently determined and maintained, that is especially to be kept up to date.
  • all existing and / or connected or embeddable databases are advantageously indexed. From the user's point of view, such a resolution of the separation of database and file system otherwise given, for example, in search engines is thus created or provided.
  • the solution according to the invention thus enables independent of the technical realization of the persistence of data, a search of content.
  • there is virtually created a combination of indexes and databases which enables different search options according to contexts, in particular an integration of precise search queries and data sets.
  • Query ⁇ s are analyzed and converted for an internal query of the data sources.
  • the solution according to the invention advantageously makes it possible to integrate data sources without having to replicate data or to use resources for redundancy.
  • a data processing system according to the invention advantageously has a structuring which makes it possible to integrate data sources without having to replicate data or to use resources for redundancy (plug-in structure of the data processing system). The otherwise high development effort and large system resources requiring connection of data sources for data migration can thus be advantageously eliminated.
  • the solution according to the invention also takes into account local data stocks that, for example, different users in a computer network can share with one another for use, for example different employees in a company network, in particular a client server server. Network. Contents and their correlations are thus usable in a company network, for example for market research and / or competitive analyzes or similar applications.
  • the link is generated by a syntactic comparison of the at least one at least one information representing date of the request for a context (context request) and the at least one database.
  • the peculiarity of the inventive technique is a syntactic comparison on the basis of insertable modules, so-called plug-ins respectively writable rules (keys).
  • a solution is used in which the information of actions by a user or automatic process is communicated to all data source-managing system components (plug-ins) in order to initiate actions themselves or make changes to the data.
  • the syntactic analysis is used in combination with other analyzes to realize fast results and an immediately deployable overall system.
  • a further advantageous embodiment of the invention provides that the link is generated by a semantic comparison of the at least one datum representing the information of the request for a connection (context request) and the at least one dataset.
  • a semantic network from which relationships can be detected, is advantageously generated.
  • the various possibilities of link generation are used in combination.
  • the solution according to the invention works with a combination of syntactic and / or semantic analysis processes in order to achieve a high learning speed.
  • the link is generated by manual input, preferably by a selection input.
  • further comparisons for linking detection can be integrated into the data processing system according to the invention.
  • the user can integrate further analysis methods and / or methods in addition to the abovementioned possibilities of linkage detection and extend the data processing system accordingly to his individual needs.
  • Another advantageous proposal of the invention is characterized by at least one electronic use of at least one information representing date of at least one database as the at least one at least one information representing date of the request for a context (context request).
  • a particularly advantageous embodiment of the invention is characterized by a detection of electronic uses of at least one information representing data of at least one database after time and / or frequency and use of this detection as the at least one at least one information representing date of the request for a context (context request)
  • a further advantageous embodiment of the invention is characterized by at least one detection of a relationship as electronic use of at least one information representing date of a database.
  • a further embodiment of the invention is characterized by the use of at least one reference to at least one data representing information comprehensive data.
  • the correlation is weighted.
  • the dynamics of the detection of relationships can be advantageously further increased or weakened.
  • the contextual weighting of at least one relationship already recorded as data representing at least one information in a database is changed as a function of the contextual weighting of a subsequently acquired relationship;
  • the weighting is carried out not only according to a percentage accuracy of a search query, but on the basis of the inventive solution by dynamic detection formed semantic network, which is independently and continuously optimized by numerous parameters, in particular by continuous updating of the detected relationships. Details of this iterative process comprising several bifurcations are given in particular in connection with the description below of the flow diagrams shown in the figures of the exemplary embodiments, in particular from FIG. 14.
  • At least one detected relationship is reproduced, preferably on the part of an optical and / or acoustic display device of the data processing system according to the invention or of a data processing device according to the invention.
  • the weighting is reproduced with the detected context.
  • weights are provided with an expiration time to depreciate relationships as a function of time. Since every user will use the solution according to the invention with varying intensity, it is expedient to use a counter for the expiry time which uses an action as the smallest time unit. In this case, an action is preferably the calling of a content, including the processing of the same and / or the creation of a new content from the data processing system. In a further embodiment of the invention, the period of time within which a user has used a connection, for example looked at, is used in the determination of the expiration time.
  • the expiration time of a weighting of a relationship increases, the longer and / or more often the user has dealt with a content, since its importance to the user is higher or must be.
  • the subject matter of the present invention is furthermore a data processing system with data representing information in at least one dataset accessible via at least one data source, which is designed and / or set up to at least partially execute a method according to the invention.
  • a further advantageous embodiment of the invention is characterized by a graphical user interface for inputting and / or reproducing Connectivity queries, associations, relationships, and / or context weights.
  • the graphical user interface is further designed and / or set up for the input, modification and / or reproduction of data representing information in at least one dataset.
  • the user interface advantageously provides a graphical user interface that enables action-oriented navigation. In other words, instead of possible functions which are otherwise offered to the user for selection in the context of hierarchically structured menu structures, options for action according to the invention are offered for selection, which makes sense or makes sense in the context of the situation or respectively retrieved contents.
  • the action-oriented navigation uses a binary basic structure that allows on the one hand an input of content and on the other hand an output of content.
  • this action-oriented, binary navigation with cross-device validity that is realized independently of the respective data processing device.
  • the graphical user interface divides the optical display area available for display by an optical display device into three areas, wherein in a first area the result of a selection of information representing data, in a second area with a display information selected from the selection in the first area and in a third area that reproduces at least one relationship.
  • the reproduction of the information selected from the selection in the first area in the second area preferably takes place as a preview or as a full view of the information.
  • the display area can also be provided in the form of a window on the part of the display device.
  • Another proposal of the invention is characterized by a horizontal or vertical division.
  • the size of the areas is adjustable and / or adjustable.
  • the reproduction is at least partially in a selectable form, that is, the reproduced relationships are formed for example as a menu option for action options and / or link in the manner of a link, and by selection, for example by so-called "clicking", usable accordingly.
  • content or content containing documents are reproduced as part of a preview by the data processing system. This further improves the orientation possibilities for users in the contexts and contents.
  • the preview during navigation or the control by databases is reproduced, so that the user can obtain a quick overview of relationships.
  • this preview contains a summary of the content, for example, a reduced with regard to the elements or components shown website or a summarized text.
  • the data processing system preferably in the context of running on a computer software, used for the dynamic organization of information and / or processes.
  • the data processing system according to the invention is part of a database application or at least usable together with a database application.
  • the subject matter of the present invention is furthermore a data processing device for the electronic processing of data, comprising a control and / or arithmetic unit, an input unit and an output unit, which is designed and / or configured to at least partially execute a method according to the invention, preferably by using at least a part of one inventive data processing system.
  • a data processing device for the electronic processing of data, with a control and / or computing unit, an input unit and an output unit, provided, which is characterized by a use of a data processing system according to the invention.
  • the data processing device is designed as a mobile terminal, preferably as a usable or operable in mobile networks mobile terminal. Particularly preferred is an embodiment of the data processing device as a mobile phone.
  • the data processing system according to the invention is designed such that it can run with a Java VM, so that the data processing system can in principle be used on all mobile terminals.
  • the data processing device supports the special ergonomics of the data processing system.
  • the solution according to the invention advantageously includes and implements in a preferred embodiment of the invention the following methods, systems and / or devices for detecting relationships between information representing information:
  • n-to-n Shortcuts (n: natural, whole Zahi) are captured.
  • the human brain abstracts or processes stimuli of its sense organs as mental presentations into mental representations, for example, the human brain derives a moving object from synchronously activated stimuli by means of the visual perception system. Connections between contents (information representing information) are detected in the inventive solution , In iteration processes, information or contents can be condensed into knowledge on the basis of the corresponding dynamic relationships. Furthermore, according to the invention, the correlations thus acquired according to the invention can be used as new content even in the form of information representing information, for example as options for action which are offered to the user for selection or are incorporated into process controls or the like in the context of automated processes.
  • the inventive solution is pragmatic and self-organizing, so that no configurations by the Users are required. The solution according to the invention nevertheless allows open controls by the user.
  • various methods for producing, modifying and resolving dynamic n-to-n relationships are used in combination with one another, in particular links through manual inputs, links through syntactic comparisons and / or links through semantic comparisons.
  • mathematical-statistical analysis methods can be used to detect relationships.
  • the relationships detected by links are weighted. The weighting is advantageously carried out with values, preferably with values between 0 and 1, corresponding to no correlation (value 0) or an immediate relationship (value 1).
  • Relationship links through manual inputs on the part of the user can be provided with the largest possible weighting value, in the present case 1, that is to say the weighting of the linkage acquires the highest and fixed value.
  • the ergonomics of action-oriented logic described in greater detail below is used.
  • a smaller value may be set to incorporate the link into the semantic network.
  • semantics In contextual relationships by semantic comparisons, dynamic relationships are advantageously determined by or by means of the sequence of contents (information representing data) of databases (files and / or databases) and / or uses of content (information representing data) of databases (files and / or databases ) detected.
  • the solution according to the invention advantageously uses findings of implicit semantics.
  • semantics is implicit because it is not explicitly defined by a But rather after the realization that relationships between content such as meanings in a language do not arise by definition, but dynamically through the use of the same. Thus, meanings of a language arise through the use of the language and interrelationships between contents according to the invention in that these contents are used. In this sense, semantics can not be abstracted from the language practice or, in the present case, from the content.
  • each dynamic link inherently receives a value between 0 and 1, where the value 0 indicates that there is no connection and the value 1 indicates a direct connection, which has been established, for example, manually or by syntactic comparison.
  • the solution according to the invention logs all actions of the user with the data processing system or the sequence of all accessed or used content, such as edited content.
  • the contents are - as already explained - information representing data of any data, such as a file and / or a database understood that may come in or from different data formats and from different data sources.
  • Each link is advantageously also provided at the same time with a decay time of a predeterminable unit of time, wherein in a unit of time, the value of a link is attenuated and ultimately tends to zero after several units of time.
  • a pattern is a sequence of content calls that recur regardless of their order.
  • the patterns can be of different size or number of contents per sequence and advantageously form a so-called cluster, which forms an issue beyond the context on a semantic meta-level.
  • Such a topic would, in turn, be named, for example, as a connection request with the aid of a syntactic comparison for the purpose of recording.
  • the solution according to the invention is able to determine the relevance of detected relationships for the respective user by means of the semantic comparison determine.
  • the solution according to the invention avoids an excessive flood of information and is able to answer contextual requests of the user in a more precise and focused manner.
  • the relevance of the inventive solution can also be used to self-organizing care of the data processing system, for example, to remove unused, old and / or unimportant or unimportant data that would otherwise burden the data processing system.
  • the solution according to the invention trains the user-specific rules for the syntactic analysis of the contents. If the user requires, for example, invoices and orders when he calls up an address record, these relationships are also preferably displayed by the data processing system according to the invention.
  • content categories the solution according to the invention means contents which have formal similarity, for example electronic mail (e-mail), addresses, invoices, orders, project plans, appointments, and / or the like.
  • the results of interest analysis are represented by a dynamic mesh whose relationships can be amplified or mitigated.
  • connection request can advantageously be initiated in different ways, for example by dynamically recorded uses of the data processing system by the user or by a manually or - when integrating a speech recognition and natural language interpretation by the data processing system - verbally asked connection request, for example, in a designated Search field on the part of a graphical user interface for controlling the data processing system according to the invention.
  • An action analysis examines which uses of content the user preferably needs in connection.
  • the solution according to the invention is able to dynamically offer options for action that make sense in the respective case for the user or are particularly likely due to its usual mode of action. So it makes sense, for example, that in a corresponding data processing system or the like application, a generated invoice is posted or an e-mail can be an answer.
  • a so-called pattern analyzer is advantageously used in the present case, a process which searches in unstructured contents for patterns which it recognizes as independent content or uses for a summary of contents.
  • the so-called pattern analyzer recognizes an address or an image in the text and can use this information to make it available as independent content.
  • Websites can be used in this way to an automated address search.
  • the pattern analyzer advantageously takes up the concepts of the described semantic analysis according to the invention. It is anticipated that selected content, such as e-mails, will be evaluated automatically and provided as structured information.
  • the analyzer checks whether there are links between the links and whether a meta-link can be established.
  • the semantic analyzer For creating meta contents or identifying topics, the semantic analyzer first checks how many links exist to a content. If a critical number, which can be defined dynamically, is reached and there is no meta content that contains the set of links of the content examined by the analyzer as a subset of its links, a new meta content is created. For this, the individual contents are brought together and brought together. This can advantageously be done with the Pattern Analyzer or other analysis methods or methods. If a topic exists and the critical number of links is undershot, the meta content is deleted. Meta contents can advantageously be managed via a corresponding plug-in.
  • the solution according to the invention is in principle able to integrate unlimited databases in the form of files and / or databases of different formats and from different data sources into the data processing system.
  • the data sources should neither be imported nor modified in order to advantageously remain functional and usable in their original system context. This serves to protect investment and also accelerates or supports an implementation of the solution according to the invention.
  • the data processing system according to the invention advantageously has a central data management - hereinafter referred to as "repository" - on which contains references to the various databases and data sources. It does not store the complete contents, but only references to the respective data. As a result, duplicate data storage can be avoided.
  • the solution according to the invention is capable of integrating information representing data as contents from different databases both databases and files, in different formats from very different data sources, for example via the Internet or a local corporate network, to identify their structure and Identify the determined relationships of the contents or content components, for example, the sender of an e-mail.
  • the individual content components are advantageously set in relation to corresponding content components of other contents.
  • FIG. 1 is a block diagram of the principal components of a data processing system according to the invention.
  • Fig. 2 shows a basic embodiment of a communication between selected components of the invention
  • FIG. 3 shows in a block diagram a further basic embodiment of a communication between selected components of the data processing system according to the invention according to FIG. 1;
  • Fig. 4 shows another basic embodiment of a communication between selected components of the invention
  • FIG. 5 shows a block diagram of a basic exemplary embodiment of a program implementation of a communication between selected components of the invention
  • FIG. 6 is a block diagram of another basic embodiment of a program implementation of a communication between selected components of the invention
  • FIG. 7 shows principal details of the communication according to FIG. 6;
  • FIG. 8 shows a block diagram of a further basic exemplary embodiment of a program implementation of a communication between selected components of the invention
  • FIG. 9 is a block diagram of another basic embodiment of a program implementation of a communication between selected components of the invention.
  • FIG. 10 is a block diagram of another basic embodiment of a program implementation of a communication between selected components of the invention
  • FIG. 11 shows a flowchart of an embodiment of a context detection according to the invention.
  • FIG. 12 is a flowchart showing another embodiment of a connection detection according to the invention.
  • FIG. 13 shows a flowchart of a further embodiment of a context detection according to the invention.
  • FIG. 15 is a flowchart showing another embodiment of a context detection according to the invention.
  • 16 is a flowchart showing another embodiment of a context detection according to the invention.
  • FIG. 17 is a schematic representation of a basic embodiment of a graphical user interface according to the invention for the use of a data processing system according to the invention
  • Correlation detection and 20 shows in a flowchart an exemplary embodiment of an inventive ontological coherence detection in the context of a context detection according to the invention.
  • the data processing system consists of several components, which in turn contain further subcomponents.
  • the respective main components for a general overview of the architecture of the data processing system will be described below. Background of the architecture shown and described here is that the components do not necessarily have to be executed within an application, but also a division into different applications and systems is possible. This supports both a so-called stand-alone and a so-called client / server application.
  • the data processing system has a user interface, a kernel and a so-called repository.
  • the user interface (called GUI in the following) is the interface to the user.
  • the user interface (GUI) is realized and designed in such a way that the ergonomic needs of the user or user are completely fulfilled.
  • the user interface (GUI) is platform-dependent or device-dependent and is accordingly adapted individually to each individual platform or data processing device.
  • implementations of the user interface (GUI) for PC's, PDA's, web or HTML applications, mobile phone or WML / WAP applications are provided, which are preferably implemented by means of or as JAVA applications.
  • the kernel is the central application core of the data processing system, where all components converge and connect to each other.
  • the kernel itself is subdivided into further subcomponents, hereafter IQser, Content Provider, crawler, logger or tracker (not explicitly shown in FIG. 1) and called analyzer.
  • the kernel provides an interface to the graphical user interface (GUI), hereafter called the IQser component.
  • GUI graphical user interface
  • the respective method calls of the user interface (GUI) are forwarded to the respectively responsible components and, if necessary, prepared accordingly before the return to the user interface (GUI), as can be seen from the principle illustrated in FIG.
  • the execution of the respectively requested tasks according to FIG. 2 is carried out by the respectively intended components.
  • Fig. 3 gives an exemplary overview of the compounds of the individual components with each other.
  • the IQser component is the controller instance that controls access to the repository or repositories and controls the crawler and analyzer processes. Furthermore, the IQser component realizes the task of integrating the respective content providers into the system.
  • the component Content Provider is an abstract component. In the present case, this is a framework that makes it possible to integrate any data source into the data processing system. This makes the overall system very flexible and can be integrated into the existing infrastructure of the user.
  • the crawler component has the task of searching for new content objects or changes to existing objects. All changes and updates are synchronized in the repository so that the repository is always up to date.
  • the process implemented by the crawler component runs in the background and is started over a freely definable interval.
  • the task of the logger or tracker component not explicitly shown in FIG. 1 is to log each activity of the user with a content (also referred to below as a content object). This logging is required to later capture certain processing or usage patterns of the user in relation to different content objects in the analyzer and, if necessary, to create or delete less relevant connections (so-called "weak links”) between objects.
  • a content also referred to below as a content object.
  • the analyzer component runs as an independent process in the background of the data processing system and performs several tasks. For one In a semantic comparison, the analyzer component searches for activities logged on the logger or tracker component according to patterns, and creates or deletes these relationships in the repository. As a result, the data processing system can dynamically recognize and virtually learn connections between content and its uses. In syntactic comparisons, the analyzer component compares the actual contents of a data store (content object) to text fragments that point to other data (content) objects.
  • the data processing system refers to external databases and uses them for context recording. This can be entries in foreign databases, for example e-mails or addresses, but also documents and objects of the data processing system itself. If the user follows a relationship reference, the data record or the external document opens in the corresponding application. If the user accesses a database via network connections, the document opens, for example, in an additional browser window, after it has been correspondingly converted by the data processing system.
  • the repository is the interface for data storage.
  • relationships and / or references to the data assets (content objects) and their respective links are verwaitet.
  • FIG. 1 shows by way of example only one repository. However, several repositories can also be integrated into the data processing system, so that, for example, local, server-based relationships and databases can be integrated into the respective user system.
  • the data processing system further has an interface for the integration of databases in order to be able to process any conceivable type of content in the form of data representing information. Since generally not all possibilities and types of integration of databases are predeterminable from the outset, the content provider component is presently implemented as a programmable interface. This allows developers to customize additional content providers to use by the data processing system.
  • This programming interface is also called plug-in below and is shown in FIG. 4.
  • the plug-in ( Figure 4) consists of several objects to be implemented by the developer:
  • the content object is the actual content. It is used to exchange the contents between the components.
  • - ContentView the interface to the GUI. This implements the presentation and the possible actions or uses of the content.
  • plug-ins are managed by two objects, the plugin manager and the plugin.
  • the task of the PluginManager is to search for installed plug-ins when starting the IQser component of the data processing system, to load and initialize existing plug-ins.
  • the plugin itself is used here as a data container. It contains an instance of the ContentProvider and the configuration of the respective plugin.
  • a plugin For the development of a new plug-in the developer has to implement the objects ContentProvider, Content and ContentView.
  • the configuration of a plugin is done via a file (in this case plugin.xml), which must be present in the respective plugin directory. If it is missing, the directory is not adopted as a plug-in by the component of the data processing system referred to herein as the IQser.
  • FIG. 6 shows, by way of example, the processes implemented by the crawler component which take place in the background of the application of the data processing system.
  • the databases are searched for new and changed content and stored, for example, in the form of a table for analysis.
  • the processes are in this case carried out with a low priority at periodic intervals.
  • the so-called crawler of the PluginManager gets the list of installed plugins and works them successively.
  • Each ContentProvider of a plugin is queried for new or changed content objects.
  • the ContentProvider delivers a list of Content-Ids back. These lists are then stored by the crawler in a cache table. The table is then processed again by the analyzers.
  • the task of the so-called logger or tracker component exemplified in FIG. 8 is similar to that of the crawler component.
  • the tracker or logger logs the actions of the user to content objects. This logging later collects patterns in the processing and / or use of content through the InterestAnalyzer and makes them available for further use. Thus, relationships between content can be created dynamically. These relationships are weighted low and, as soon as they have not been used for a longer, predefinable period of time, are virtually forgotten by release.
  • the period over which the tracker or logger is to log the activities is configurable. The shorter the period, the faster the processing. The longer the period, the higher the possibility of recording processing or usage patterns.
  • the analyzer shown in Fig. 9 is a process that analyzes in the background of the data processing system the contents "found" by the crawler according to various criteria.
  • - InterestAnalyzer Analyzes contents according to patterns in the processing or use by the user.
  • an analysis can begin by calling the analysis process.
  • the analyzer considers the first two entries of the protocol. If the second entry is not an event triggered by the selection (for example: "to display") of a content, the syntax analysis starts (see Fig. 11) Context (also called selection below), the syntax analysis is skipped. If both entries are an event that has been triggered by the user, then both contents are examined in each case in the semantic and interest analyzer and. Subsequently, further analysis steps can follow. When all analysis steps have been performed, the first entry is deleted. Now the entire process is repeated until there is only one entry left in the log.
  • the process of a so-called meta-analyzer is shown.
  • the metaanalyzer checks whether the number of links to a content under investigation exceeds a limit n. If not, it checks to see if there is a meta content that needs to be deleted if it exists. Once the limit has been reached, a check is first made as to whether there is a meta content. In both cases, all linked content is merged and summarized. If there was already a meta content, this is updated by the summary. If there was no meta content, one will be created and stored in a database.
  • the repository exemplified in detail in FIG. 10 is the interface to the databases. It takes over the storage of all data relevant to the kernel, in the present case these are in particular:
  • the SemanticAnalyzer asks if the weight is less than 1. If this value is 1, the analysis is aborted, if it is less than 1, it will continue. Now, the weighting of the link is increased by a minimum value greater than 0. Following this will be checks if the resulting weight is greater than or equal to 1. If the value is less than 1, the semantic analysis is finished. If the value is greater than or equal to 1, the weighting is reduced to a maximum value less than 1. Following this, all other existing links are called and their weighting reduced by a factor corresponding to the reduction of the link currently being examined. The SemanticAnalyzer is then terminated.
  • FIG. 11 shows the iterative analysis process of the context detection.
  • various analysis processes are used in combination.
  • the analysis process starts from an entry in the tracker (event log) and ends when only one entry remains in the tracker.
  • the analyzer component has the task of independently recognizing the relationships between the contents.
  • the data processing system combinatively uses in particular a syntactic and semantic analysis.
  • FIG. 12 shows the sequence of the processes already explained above in the context of a semantic analysis.
  • FIG. 13 shows the basic structure of the processes in the context of a syntactic analysis.
  • FIG. 11 shows the basic method steps realized by the analyzer component.
  • log files or the database entries are processed according to the chronological sequence in which the individual items were written. If entries have been processed in this way, they are deleted from the list, but at least the last action remains stored.
  • the length of the list of actions in the log file or the database table depends on how fast the analyzer is working or how much computer power is allocated to the secondary thread. The priority is always the thread of the IQser component or the actions that the user of the data processing system performs. As soon as a new action is written in the logfile and the analyzer was not yet active, the analysis for context detection begins. The following situations can lead to the call of the analyzer:
  • At the start of the data processing system at least two entries from the last session are already in the log.
  • the crawler has identified new content, such as a new plugin.
  • the user creates a new content.
  • the user selects a content from a retrieved list.
  • the SyntaxAnalyzer determines the rules for syntax analysis by calling the "keys" for each content to be examined, which are attributes that describe which information building blocks (data fields) and data types are used to determine meaningfulness From the keys, the analyzer assembles a filter that will trigger a search on the total recorded dataset, and finally creates a link to the content found, which depends on the implementation and the requirements of the user with 1 or a maximum value less than 1 or the accuracy of the score is weighted.
  • an internal threshold after which a dynamic link is displayed or not.
  • the value (weighting) changes depending on the user behavior or the evaluation of the log of all actions that the user performs with the data processing system.
  • the relationships are mapped as dynamically linked objects.
  • FIG. 15 shows and describes by way of example how the corresponding plug-in is queried for a crawler task for the purpose of identifying new contents. From a technical point of view, this synchronization process implementing subsystem is a so-called class, which queries the respective data sources of the plug-in for new, deleted or generated relationships.
  • FIG. 16 shows and describes by way of example the sequence of an analysis of full texts according to the invention within the scope of a context detection according to the invention, wherein at least one word of a list (word list) created from a full text of words contained in the full text is the date of the request representing at least one information item is used after a context (context request).
  • the word list created from a full text in the pattern analysis is sorted in ascending order according to the frequency of the words.
  • the first 32 words of the resulting list is placed as a query - that is, as a request for a context (context request) - to a full-text index of a search engine.
  • a list of similar documents is provided with a weight determined by the search engine.
  • the data processing system according to the invention further provides a cross-device man-machine interface for the display, processing and control of complex content or databases and their correlations, in particular to meet the requirements for a transparent control for the modification of large databases and their contexts and one in particular understandable to the untrained user and simpler compared to other systems.
  • the logic and ergonomics used by the man-machine interface are independent of the data processing devices or data processing terminals used for or with the data processing system according to the invention, for example their output units such as monitors or displays.
  • an action-oriented control of the data processing system is made possible with the human-machine interface of the data processing system according to the invention.
  • the action-oriented control of the data processing system replaces the functional menu control of computer-aided programs which is generally used today.
  • a functional menu control provides a selection of functions that are grouped by abstract criteria and accessible in menu trees. Such abstract criteria are for example "File” and "Edit” for the Windows operating systems of the company Microsoft.
  • inventive action-oriented control works - also action-oriented. Called navigation - with context-sensitive action options that are structured in binary in every application situation of the system. The binary structure refers to an input on the one hand and an output of content on the other hand, or to the writing or changing and displaying of data.
  • the binary options for action are adapted as a function of the respective action context, that is to say new options for action can be added depending on the respective action context and / or other options for action can be omitted.
  • the binary action-oriented control can also be applied to all output media, for example in the case of small displays of mobile terminals or voice input and / or output, for which purpose the data processing device advantageously has microphone and loudspeaker as input and output units.
  • the control or navigation through complex data inventories and their relationships is realized by the human-machine interface of the data processing system according to the invention advantageously with a graphical user interface which serves for the input and / or reproduction of contextual requests, links, relationships and / or context weightings.
  • the graphical user interface is designed for entering, changing and / or reproducing information representing information in at least one database.
  • the graphic user interface divides the display area available for display by a display device into three areas, wherein data representing information in at least one data area accessible via at least one data source is present in a first area, at least one date of a connection request representing at least one information in a second area in a third area at least one detected Relationship between the at least one information representing date of the connection request and the at least one information representing date of the data is reproduced.
  • triadic windowing technology The division according to the invention of the display area into three subregions is referred to below as triadic windowing technology. While the windowing techniques known from the graphical user interfaces of modern operating systems use either list, icon or tree diagrams to represent the hierarchical structure of the data and files of a computer system, the triadic windowing technique of the invention operates with a horizontal or vertical trisection of the available display area (window ).
  • FIGS. 17 and 18 each show a corresponding graphical user interface.
  • the data processing system according to the invention can be used in the form of a so-called web browser (FIG. 17) or a so-called JAVA client (FIG. 18).
  • a selection of contents is shown as a tabular list in the upper third of the display area (window), and a detailed view of one from the first list in the second third of the display area (window) selected content and in the last third of the display area (window) all content associated with the selection, for example, also appear in a list or played.
  • the user sees at a glance which contents belong together and from there can continue to navigate in order to search for contents or to derive insights from the correlations.
  • Epistemology shows that knowledge arises through the linking of information.
  • the data processing system according to the invention thus not only makes information transparent but also knowledge.
  • an animation is advantageously started, which pushes the last animation upwards, wherein the "triadic window" to be seen subsequently has the same structure and the same logic. Furthermore, the user can also navigate back, so that the animation reverses accordingly.
  • vertical division of the display area for example, in the upper third of the display area (window) is the result of a (selection) in the form of a list of contents, in the second Third of the display area (window), the links or the relationships to a selected content from the list of the first area and in the last third of the display area (window) a preview of the selected content (information representing date).
  • the preview reproduced in the third area of the display area is sometimes easier to read or to see if the size ratio between the first two areas and the third area is variably adjustable, so-called "split-plane".
  • the control or navigation is advantageously limited in this case to the first two areas of the display area, while the preview in the third area at the same place simply changes.
  • the order of the panes may vary depending on the implementation.
  • An advantage of the graphical user interface of the data processing system according to the invention is that the user can see at a glance which contents belong together and can continue to control or navigate in order to search for content or to derive insights directly from recorded relationships. In this case, an endless control or navigation is provided according to the invention.
  • List entries can be dragged and dropped into the list of references to create a link. A double-click opens the detail view in a new window;
  • Detail List entry has scrolling bars to fully view lists and detail lists that are not fully viewable in the pane; 6: Column positions stored with functions, for example, an e-mail address leads to a mask for writing an e-mail and
  • GUI user interface
  • the user selects a menu item from the menu or the navigation for displaying contents, for example to see all recent projects.
  • the list of menu items to be selected is similar to a bookmark list of a browser.
  • the bookmarks do not refer to static pages or lists, but to dynamic relationships. Accordingly, this part of the navigation will look different from user to user.
  • the data processing system is implemented as a JA VA client.
  • the user invokes the edit mode of a content object.
  • the user will find a free field in which he can enter a new attribute or select from a list on the left.
  • An address is an object for which the IQser suggests attributes.
  • FIG. 19 shows and describes by way of example the course of a context search according to the invention in the context of a context detection according to the invention.
  • a context search according to the invention in the present case, only those contents which are related to a specific content are searched in a semantic network. This makes the search considerably more context-dependent.
  • the context search is transferred with a search string and a content ID to the data processing device, preferably a server.
  • the flowchart of FIG. 19 shows, a search query based on the search string is first carried out. Then the links to the content object are called, in the context of which the search result should be. Then this list is iterated and checked whether a list entry occurs in the search result. If so, this list entry is included in the result list.
  • the context request advantageously takes place as a request to a search engine.
  • a context request with the at least one specifiable information takes place as the at least one date of a context request representing at least one information
  • a context request with the at least one result of the context request with the search string as the at least one at least one Information representing date of a connection request with the Content-ID.
  • FIG. 20 shows an exemplary embodiment of an ontological coherence detection according to the invention within the scope of an inventive method
  • Implicit ontology means that a set of statements in the sense of a subject-predicate-object relationship (SPO relationship) is generated automatically, which also plays a role in the semantic web, in particular OWL and RDF. This allows natural language queries that can be resolved using AIML.
  • SPO relationship subject-predicate-object relationship
  • the SPO relationship is established and stored. Whenever a link is generated, the method becomes createl_ink (c1, c2, p, w)
  • the first variant advantageously provides for clarity in the display of the links.
  • FIG. 20 shows how the context request "Who is the author of documents dealing with environmental protection?" is implemented ontologically according to the invention.
  • This provides a new method that enables complex queries.
  • a database of subject areas is connected via a plugin. For each subject area, an expert can assemble the morphemes and words that are characteristic of the subject area.
  • the automatic analyzes of the solution according to the invention take over the task of assigning texts as well as the relationship of subject areas that are complementary or include within the context of contextual requests. As a result, the user can navigate through subject areas and find corresponding sources.
  • the company provides a collection of text that is examined with a special tool for characteristic words and morphemes. For this, a word list is generated from the texts, whereby each word is assigned the statistical frequency. This word list is filtered by a list of articles and base verbs (stop words) and placed in a descending order of word frequency. The 32 most common words are used to describe the subject area.
  • a text is converted into a word list.
  • Each word is then compared with the database of the project German vocabulary (http://www.wortschatz.uni-leipzig.de) from which the subject area is determined.
  • a list of subject areas arises from the word list according to the invention. This list, in turn, is summarized by each subject occurring only once with the assigned frequency. Then the list is sorted in descending order. The three most frequently occurring subject areas are assigned to the content (Content-Object) as tag.
  • a particularly preferred and precise method of the invention is given with a difference analysis.
  • two text collections are advantageously compared.
  • Preferably a collection of texts with general topics, for example the basis of the project Deutscher Vocabulary, and a collection of texts with texts from a certain subject area.
  • a word list is generated, preferably without duplicates.
  • the words are sorted in descending order of frequency along with this value.
  • the relative frequency is calculated from the quotient of the absolute frequency and the total number of word forms of the respective list.
  • the two word lists are compared.
  • a quotient of the relative frequency of the same list with the relative frequency from the other list is formed for each word. Subsequently, the thus-supplemented word list is sorted by this value.
  • the 32 most frequent words are selected as descriptive for a subject. These 32 words can be used to describe a subject area within the scope of an inventive Solution (IQser) can be used to automatically assign texts using pattern analysis.
  • IQser inventive Solution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die vorliegende Erfindung betrifft ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes erfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes erzeugt wird. Ferner betrifft die vorliegende Erfindung ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand sowie eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche jeweils ausgebildet und/oder eingerichtet sind ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen.

Description

Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten
Die vorliegende Erfindung betrifft ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandeserfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandeserzeugt wird.
Ferner betrifft die vorliegende Erfindung ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, welches ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen. Gegenstand der vorliegenden Erfindung ist darüber hinaus eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines erfindungsgemäßen Datenverarbeitungssystems.
Verfahren, Systeme und Vorrichtungen zur elektronischen Verarbeitung von Daten sind im Stand der Technik in zahlreichen Ausgestaltungen bekannt, insbesondere aus der WO 2005/050471 A2, deren Offenbarungen hiermit explizit referenziert werden.
Verfahren, Datenverarbeitungssysteme und/oder Datenverarbeitungsvorrichtungen der eingangs genannten Art finden im Rahmen von Suchanwendungen beziehungsweise - routinen, beispielsweise seitens Betriebssystemen und/oder seitens sogenannter Suchmaschinen, sowie im Rahmen der Organisation, Bereitstellung und/oder Auslieferung von Informationen Verwendung.
Üblicherweise werden Inhalte als Informationen repräsentierende Daten eines Datenbestandes maschinell verarbeitet, insbesondere um Anwendern als technisches Hilfsmittel zur Lösung von Aufgaben zur Verfügung gestellt zu werden und/oder zu dienen. Datenbestände im Sinne der vorliegenden Erfindung sind einfache, universell nutzbare, persistente Datenobjekte die insbesondere wie Dateien und/oder Dokumente in Betriebssystemen oder Datenbanken, Struktur-, Inhalts- und bedarfsweise Verwaltungsinformationen enthalten.
Bei Datenverarbeitungssystemen und/oder Datenverarbeitungsvorrichtungen sind die Datenbestände einem Datenverarbeitungssystem und/oder einer
Datenverarbeitungsvorrichtung üblicherweise über wenigstens eine Datenquelle, in der Regel einem in einem Datenverarbeitungssystem vorhandenen oder über ein Kommunikationsnetzwerk anschließbaren beziehungsweise verbindbaren Datenträger, beispielsweise einer Festplatte oder dergleichen Datenaufzeichnungsmittel, zugänglich.
Betriebssysteme arbeiten mit einer hierarchischen Ordnung von Dateien, beispielsweise in ihrem sogenannten Filesystem. Dabei sind die Dateien als Datenbestand in einer Baumstruktur in Verzeichnissen eingeordnet. Eine Navigation in den Dateien erfolgt in der Regel entlang einer aristotelischen Logik über die Namen der einzelnen Verzeichnisse bis hin zu einer Datei. Die Navigation kann dabei mehrere Schritte umfassen und beinhaltet ferner das Problem einer eindeutigen Zuordnung. Darüber hinaus wird bei Betriebssystemen die Verwaltung von Dateien von der Verwaltung von Daten, welche ausschließlich über auf Datenbanken oder dateibasierende Datenstrukturen, wie beispielsweise XML, zugreifende Anwendungsprogramme zugänglich sind, getrennt. Üblicherweise erfolgt die Trennung dabei entsprechend der technischen Implementation beziehungsweise Realisierung der Persistenz der jeweiligen Daten.
In datenbankgestützten Anwendungen kommen bisher relationale Datenbanken zum Einsatz, die statische Verknüpfungen von mit Daten versehenen Tabellen verwalten. Aufgrund der verwendeten statischen Verknüpfungen in den seitens Suchmaschinen verwalteten Tabellen, sind Änderungen in den Datenbeständen nicht beziehungsweise nur eingeschränkt und verzögert erfassbar. Die Auswertung beziehungsweise Verwendung der Daten muss vorausschauend festgelegt werden.
Suchmaschinen ermöglichen Anwendern in der Regel nur Datenbestände nach Stichwörtern beziehungsweise nach einer booleschen Kombination von Stichwörtern zu durchsuchen. Präzise Suchanfragen wie beispielsweise der Aufruf von Rechnungen oder dergleichen aus einem bestimmten Zeitraum oder dergleichen Abfragen sind nicht möglich.
Datenverarbeitungssysteme arbeiten darüber hinaus in der Regel mit einer statischen - das heißt fest vorgegebenen - hierarchisch strukturierten Menüstruktur die dem Anwender eine Auswahl von möglichen Funktionen zur Bedienung des Datenverarbeitungssystems bereitstellen. Bei Betriebssystemen, beispielsweise bei MacOS X der Firma Apple, werden ferner sogenannte Kontextmenüs verwendet. Dabei handelt es sich ebenfalls um hierarchisch strukturierte Menüstrukturen, die jedoch in Abhängigkeit der installierten Anwendungsprogramme wenigstens teilweise um entsprechende Menüpunkte zum Starten beziehungsweise Aufrufen einzelner Anwendungsprogramme und/oder von Funktionalitäten derselben ergänzbar sind. Abgesehen von der Ergänzbarkeit der Menüstrukturen sind diese in ihrer Nutzung dennoch statisch hierarchisch strukturiert. Die insbesondere bei Datenverarbeitungssystemen bisher gegebene statisch hierarchische Strukturierung von Menüstrukturen kann somit Nutzungsvorlieben eines Anwenders nicht beziehungsweise nur bedingt nachkommen. Eine Berücksichtigung des jeweiligen Benutzungskontextes seitens der Menüstrukturen, wobei insbesondere die Menüpunkte in einem Menü angeboten werden, die im Kontext der Situation beziehungsweise der aufgerufenen Inhalte Sinn macht beziehungsweise sinnvoll ist, ist nicht möglich, insbesondere nicht aufgrund der statisch hierarchischen Strukturierung der Menüs. Die Synchronisation von Informationen repräsentierenden Daten in Datenbeständen zwischen verschiedenen die Datenbestände gemeinsam nutzenden Datenverarbeitungsvorrichtungen ist - insbesondere angesichts der zunehmenden Verbreitung von mobil nutzbaren Datenverarbeitungsvorrichtungen wie sogenannten PDA's (PDA: Personal Digital Assistant) - ein wichtiger Bestandteil von Datenverarbeitungssystemen und ist beispielsweise in Form von sogenannten PIM- Systemen (PIM: Personal Information Management) in Datenverarbeitungssystemen integriert . Die Funktionalität der Synchronisation ist dabei bisher auf eine rein manuelle Auswahl von zu synchronisierenden Informationen beschränkt. Ein Anwender kann dabei beispielsweise durch manuelle Eingabe lediglich auswählen, welche beziehungsweise welchen Teil seiner seitens des Datenverarbeitungssystems verwalteten Kontaktadressen er synchronisieren will. Eine nähere beziehungsweise detailreichere Spezifizierung hinsichtlich einer inhaltlichen Beschränkung der zu synchronisierenden Informationen ist nicht möglich, insbesondere nicht als automatisierter Vorgang, der sich selbstständig dem Bedarf des Anwenders anpasst.
In Anbetracht dieses Standes der Technik liegt der vorliegenden Erfindung die Aufgabe zugrunde, die Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten unter Meidung der beschriebenen Nachteile zu verbessern, insbesondere hinsichtlich Art und Weise, Umfang sowie Handhabung der Erfassung von Zusammenhängen als auch der Nutzung der erfassten Zusammenhänge, insbesondere unter Berücksichtigung der jeweiligen anwenderindividuellen Nutzungen der Zusammenhänge.
Zur technischen Lösung wird mit der vorliegenden Erfindung ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandeserfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandeserzeugt wird, vorgeschlagen, wobei im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) nur solche Informationen repräsentierenden Daten für die Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt werden, die wenigstens einen Zusammenhang zu wenigstens einer vorgebbaren Information aufweisen.
Erfindungsgemäß wird so eine Kontextsuche realisiert, wobei nur solche Inhalte im Rahmen der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) berücksichtigt werden, die in einem Zusammenhang eines bestimmten Inhaltes stehen. Die erfindungsgemäße Kontextsuche erlaubt es so ein auffinden von Ergebnissen von Zusammenhangsanfragen mit Kontextabhängigkeit. Eine Suche ist somit kontextabhängig wesentlich verfeinert.
Eine besonders bevorzugte Ausgestaltung der Erfindung sieht vor, dass die Zusammenhangsanfrage als eine Anfrage an eine Suchmaschine erfolgt. Eine Suchmaschine im Sinne der vorliegenden Erfindung ist dabei insbesondere ein Programm zur Recherche von Dokumenten und/oder Datensätzen - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum eines Datenbestandes sind - die seitens einer Recheneinrichtung - auch Rechner beziehungsweise Computer genannt - oder in beziehungsweise über ein Rechnernetz, insbesondere dem Internet oder einem Intranet bereitgestellt beziehungsweise bereitgehalten werden. Im Rahmen einer erfindungsgemäßen Verfahrensnutzung der Zusammenhangsanfrage für beziehungsweise mit einer Suchmaschine wird vorteilhafterweise ein Schlüsselwort-Index für die Dokumentbasis - die im Sinne der vorliegenden Erfindung ein Ergebnis einer Suchanfrage beziehungsweise Zusammenhangsanfrage ist - erstellt, um Suchanfragen über Schlüsselwörter - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum der Zusammenhangsanfrage sind - mit einer nach Relevanz geordneten Trefferliste zu beantworten. Nach Eingabe eines oder mehrerer Suchbegriffe - die im Sinne der vorliegenden Erfindung ein eine Information repräsentierendes Datum der Zusammenhangsanfrage sind - wird dabei über die Suchmaschine eine Liste von Verweisen auf möglicherweise relevante Dokumente oder Datensätze - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum eines Datenbestandes sind - geliefert.
Die Anfragen nach einem Zusammenhang zwischen den Inhalten Informationen repräsentierender Daten, Zusammenhangsanfragen im Sinne der vorliegenden Erfindung, sind vorteilhafterweise selbst Informationen und/oder Aktionen repräsentierende Daten. Dementsprechend werden erfindungsgemäß vorteilhafterweise ganz allgemein Zusammenhänge zwischen zwei aufeinanderfolgenden Inhalten als Informationen repräsentierenden Daten eines oder zweier Datenbestände erfasst und erfindungsgemäß deren Kontext zueinander berücksichtigt.
Der Erfindung liegt die Erkenntnis zugrunde, dass sich durch Berücksichtigung beziehungsweise Einbindung des Kontexts von beziehungsweise zwischen Inhalten Zusammenhangsanfragen weiter verbessern und optimieren lassen, insbesondere hinsichtlich der Nutzbarkeit für Anwender einer erfindungsgemäßen Zusammenhangserfassung. Erfindungsgemäß wird eine selbstlernende Lösung realisiert. Die Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten ist damit insgesamt verbessert, insbesondere hinsichtlich Art und Weise, Umfang sowie Handhabung der Erfassung von Zusammenhängen als auch der Nutzung der erfassten Zusammenhänge. Erfindungsgemäß sind dabei Zusammenhänge als Wissen verwaltbar.
Dabei wird durch die erfindungsgemäße Verfahrensführung die Erkenntnis umgesetzt, dass Wissen durch die Verknüpfung von Inhalten entsteht. Im Gegensatz zu einer Verwendung von Begriffsnetzen, die in einer sogenannten Topic-Map gemäß ISO/IEC 13250 kodiert und beispielsweise branchenbezogen von Beratungsunternehmen oder vertikalisierten Wissensmanagementlösungen von Softwareherstellern erstellt werden, wird mit der Erfindung eine selbstlernende Lösung bereitgestellt, welche sich selbst an die Bedürfnisse und Vorlieben des jeweiligen Anwenders beziehungsweise Nutzers anpasst. Dementsprechend können die Funktionalitäten des erfindungsgemäßen Verfahrens einfach und problemlos in bestehende Lösungen, insbesondere Datenverarbeitungssysteme und/oder Datenverarbeitungsvorrichtungen, integriert werden. Aufwendige und schulungsintensive Einführungen einer erfindungsgemäßen Lösung in bestehende oder neue Projekte können entfallen. Die erfindungsgemäße Lösung ermöglicht es einem Anwender, einfach und schnell, von einem Inhalt zu über Zusammenhänge verknüpften anderen Inhalten zu kommen. Da vorteilhafterweise alle Inhalte über Zusammenhänge, insbesondere in erfindungsgemäßen Gruppierungen, mehrfach verknüpfbar sind, kann eine Navigation im Rahmen einer Zusammenhangsanfrage vorteilhafterweise auch wieder zum Ausgangspunkt der Anfrage zurückführen, das heißt zu der Zusammenhangsanfrage selbst. Der Anwender kann so vorteilhafterweise Sinnzusammenhänge erkennen, insbesondere zu beziehungsweise zwischen seinen Nutzungen, die beispielsweise für seinen augenblicklichen Interessenfokus relevant sind. In einer festgelegten, statischen hierarchischen Ordnung von Datenverarbeitungssystemen, wie sie beispielsweise bei in der Regel Baumstrukturen für die Auswahl von Inhalten nützenden Betriebssystemen und deren Anwendungsprogrammen gegeben ist, ist dies nicht möglich, da diese eine Berücksichtigung neuer Ordnungsstrukturen nicht zu lassen.
Während Anwender von Datenverarbeitungssystemen ansonsten über vom Datenverarbeitungssystem bereitgestellte Eingabemasken Daten eingeben, ermöglicht es die erfindungsgemäße Lösung vorteilhafterweise Daten entsprechend eines aktuellen Bedarfs des Anwenders zu beschreiben. So wird die Beschreibung einer Adresse oder eines Projektes durch die erfindungsgemäße dynamische Datenhaltung und die Gestaltung einer entsprechenden graphischen Benutzeroberfläche hinsichtlich der Nutzungshandhabung für Anwender äußerst flexibel und individuell, insbesondere da die Beschreibung einer Adresse oder eines Projektes nicht wie ansonsten üblich, starr festgelegt wird.
Vorteilhafterweise wird die vorgebbare Information zusammen mit einem erfassten Zusammenhang als eine Information repräsentierendes Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt. Im Rahmen einer Zusammenhanganfrage kann ein Anwender also einfach die vorgebbare Information gemeinsam mit einem Inhalt aus einem bereits zuvor erfassten Ergebnis einer Zusammenhangsanfrage eingeben und an den das Verfahren umsetzenden Prozess übergeben.
In einer besonders bevorzugten Ausgestaltung der Erfindung ist vorgesehen, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zunächst eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt, anschließend eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt und schließlich das wenigstens eine Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfasst und wiedergegeben wird.
Eine weitere vorteilhafte Ausgestaltung der Erfindung ist dadurch gekennzeichnet, dass die vorgebbare Information eine von einem Anwender und/oder einer Anwendung wählbare Abfolge von Buchstaben und Sonderzeichen ist (Suchstring).
Eine weitere besonders vorteilhafte Ausgestaltung der Erfindung ist, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zwischen den wenigstens eine Information repräsentierenden Daten einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) automatisch eine Aussagenmenge im Sinne von Subjekt- Prädikat-Objekt-Beziehungen erzeugt wird, so dass natürlichsprachliche Anfragen nach einem Zusammenhang (Zusammenhangsanfragen) erfolgen können. Erfindungsgemäß wird dabei eine Zusammenhangsanfrage mit einer impliziten Ontologie (ontologische Zusammenhangsanfrage) realisierbar.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird.
Eine vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Wörter in der Liste (Wortliste) von in dem Volltext enthaltenen Wörtern nach der Häufigkeit ihres Vorhandenseins in dem Volltext aufsteigend sortiert werden und die sortierten Wörter unter Berücksichtigung der Häufigkeit ihres Vorhandenseins in dem Volltext als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass eine vorgebbare Anzahl der nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortierten Wörter in einer Liste (sortierte Wortliste) erfasst und die Wörter der Liste (sortierte Wortliste) als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden. Vorteilhafterweise enthält die Liste (sortierte Wortliste) die Wörter mit der geringsten Häufigkeit ihres Vorhandenseins in dem Volltext. In einer weiteren Ausgestaltung der Erfindung werden die Wörter vorteilhafterweise nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortiert. Die vorgebbare Anzahl ist vorzugsweise auf bis zu 32 beschränkt, insbesondere da durch die vorgebbare Anzahl die Anzahl der für eine Zusammenhangsanfrage nutzbaren, vorzugsweise logisch miteinander verknüpfbaren Attribute definierbar ist und darüber hinaus so - wie empirisch festgestellt wurde - die Leistungsfähigkeit der erfindungsgemäßen Lösung im Einsatz seitens von Datenverarbeitungssystemen optimierbar ist.
Gemäß einem weiteren Vorschlag der Erfindung werden die Wörter der Liste zumindest teilweise, vorzugsweise vollständig - das heißt die gesamte Wortliste - parallel als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet. Dabei werden vorteilhafterweise die Wörter der sortierten Wortliste miteinander logisch verknüpft, vorzugsweise mit einer Booleschen Oder- Verknüpfung, und die Verknüpfung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet. Als Ergebnis liefert die Zusammenhanganfrage vorzugsweise über eine Suchmaschine dann einen Ähnlichkeitswert. Der Ähnlichkeitswert ist vorteilhafterweise eine prozentuale Angabe bezogen auf die Ähnlichkeit, wobei bei einem Ähnlichkeitswert von 100 % sämtliche der für die Anfrage als Attribute genutzten Wörter aus der sortierten Wörteiiiste in dem angefragten Zusammenhang, besonders bevorzugt zwischen zwei Volltexten beziehungsweise Volltextdokumenten, vorkommen und/oder relevant sind und bei einem Ähnlichkeitswert von 0 % keins der für die Anfrage als Attribute genutzten Wörter aus der sortierten Wörterliste in dem angefragten Zusammenhang, besonders bevorzugt zwischen zwei Volltexten beziehungsweise Volltextdokumenten, vorkommt und/oder ähnlich ist beziehungsweise hinsichtlich der Ähnlichkeit relevant ist. Eine Alternative und/oder ergänzende Ausgestaltung der Erfindung sieht vorteilhafterweise vor, dass die Wörter der Liste der Reihe nach als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.
Vorteilhafterweise werden die Verknüpfungen wie und vorzugsweise mit den dynamisch erfassten Zusammenhängen erfasst. Im Gegensatz relationalen Datenbanken, bei denen Verknüpfungen von mit Daten versehenen Tabellen verwaltet werden, werden bei der erfindungsgemäßen Lösung Verknüpfungen der erfassten Zusammenhänge dynamisch erstellt, vorzugsweise in n-zu-n-Relationen, wobei die Zusammenhänge verfahrensgemäß vorteilhafterweise selbstständig ermittelt und gepflegt, das heißt insbesondere auf dem aktuellsten Stand gehalten werden.
Erfindungsgemäß werden vorteilhafterweise alle im System vorhandenen und/oder angeschlossenen beziehungsweise einbindbaren Datenbestände indiziert. Aus Anwendersicht wird so eine Auflösung der ansonsten beispielsweise bei Suchmaschinen gegebenen Trennung von Datenbank und Dateisystem geschaffen beziehungsweise bereitgestellt. Die erfindungsgemäße Lösung ermöglicht somit unabhängig der technischen Realisierung der Persistenz von Daten, ein Durchsuchen von Inhalten. Dabei wird erfindungsgemäß quasi eine Verbindung von Indexen und Datenbanken geschaffen, die verschiedene Suchoptionen nach Zusammenhängen ermöglicht, insbesondere eine Integration präziser Suchanfragen und Voütextsucnen. Suchanfrageπ werden analysiert und für eine interne Abfrage der Datenquellen umgewandelt.
Die Erfindungsgemäße Lösung ermöglicht vorteilhafterweise eine Einbindung von Datenquellen, ohne Daten replizieren oder Ressourcen für Redundanzen einzusetzen zu müssen. Ein erfindungsgemäßes Datenverarbeitungssystem weist dazu vorteilhafterweise eine Strukturierung auf, die es ermöglicht, Datenquellen einzubinden, ohne Daten replizieren oder Ressourcen für Redundanzen einzusetzen zu müssen (Plug-in-Struktur des Datenverarbeitungssystems). Die ansonsten einen hohen Entwicklungsaufwand und große Systemressourcen erfordernde Anbindung von Datenquellen zur Datenmigration kann somit vorteilhafterweise entfallen.
Gemäß einem weiteren Vorschlag der Erfindung berücksichtigt die erfindungsgemäße Lösung auch lokale Datenbestände die beispielsweise verschiedene Anwender in einem Computer-Netzwerk miteinander zur Nutzung teilen können, beispielsweise verschiedene Mitarbeiter in einem Firmennetzwerk, insbesondere einem Client-Server- Netzwerk. Inhalte und deren Zusammenhänge sind so in einem Firmennetzwerk beispielsweise für Marktforschungs- und/oder der Wettbewerbsanalysen oder dergleichen Anwendungen nutzbar.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung wird die Verknüpfung durch einen syntaktischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) und des wenigstens einen Datenbestandes erzeugt. Die Besonderheit der erfindungsgemäßen Technik ist dabei ein syntaktischer Vergleich auf der Basis von in einfügbaren Modulen, sogenannten Plug-ins jeweils beschreibbaren Regeln (Keys). Das hat zwei entscheidende Vorteile: Zum einen lassen sich valide, vom Anwender spezifizierte Zusammenhänge (beispielsweise Geschäftsregeln) definieren und auf den Datenbestand anwenden. Das erlaubt zugleich eine flexible Datenstruktur. Zum anderen können durch die Regeln Zusammenhänge zwischen Informationen und Handlungsoptionen (dynamische Funktionen) hergestellt werden. Hierbei kommt erfindungsgemäß eine Lösung zum Einsatz, bei dem die Information von Aktionen seitens eines Anwenders oder automatischen Prozesses allen Datenquellen verwaltenden Systemkomponenten (Plug-ins) mitgeteilt wird, um gegebenenfalls selbst Aktionen auszulösen oder Veränderungen am Datenbestand vorzunehmen. Vorteilhafterweise kommt die syntaktische Analyse in Kombination mit weiteren Analysen zur Anwendung, um schnelle Ergebnisse und ein unmittelbar einsatzfähiges Gesamtsystem zu realisieren.
Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Verknüpfung durch einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) und des wenigstens einen Datenbestandes erzeugt wird. Im Rahmen des semantischen Vergleiches wird dabei vorteilhafterweise ein semantisches Netz, aus dem Zusammenhänge erfassbar sind, erzeugt.
In einer besonders vorteilhaften Ausgestaltung der Erfindung werden die verschiedenen Möglichkeiten der Verknüpfungserzeugung kombinativ angewendet. Im Unterschied zu neuronalen Netzen arbeitet die erfindungsgemäße Lösung mit einer Kombination von syntaktischen und/oder semantischen Analyseprozessen, um eine hohe Lerngeschwindigkeit zu erzielen.
Gemäß einem vorteilhaften Vorschlag der Erfindung wird die Verknüpfung durch manuelle Eingabe erzeugt, vorzugsweise durch eine Auswahleingabe. In einer weiteren besonders vorteilhaften Ausgestaltung der Erfindung sind weitere Vergleiche zur Verknüpfungserfassung in das erfindungsgemäße Datenverarbeitungssystem integrierbar. So kann der Anwender beispielsweise seinen individuellen Bedürfnissen entsprechend zusätzlich zu den genannten Möglichkeiten einer Verknüpfungserfassung weitere Analyseverfahren und/oder -methoden integrieren und das Datenverarbeitungssystem entsprechend um diese erweitern.
Ein weiterer vorteilhafter Vorschlag der Erfindung ist gekennzeichnet durch wenigstens eine elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage). Eine besonders vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch eine Erfassung von elektronischen Nutzungen von wenigstens eine Information repräsentierenden Daten wenigstens eines Datenbestandes nach Zeit und/oder Häufigkeit und Nutzung dieser Erfassung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage). Eine weitere vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch wenigstens eine Erfassung eines Zusammenhangs als elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums eines Datenbestandes. Eine weitere Ausgestaltung der Erfindung ist gekennzeichnet durch Nutzung wenigstens eines Verweises auf wenigstens einen Informationen repräsentierende Daten umfassenden Datenbestand. Mit diesen Maßnahmsn ist vorteilhafterweise einzeln oder in Kombination beispielsweise die Nutzung einer Datei mit einem Anwendungsprogramm als Zusammenhang erfassbar. Umfang und Handhabung der erfindungsgemäßen Lösung lassen sich so weiter verbessern und Anwendernutzungen weiter individualisieren. Für die Analyse werden erfindungsgemäß vorteilhafterweise Aktionen, Zeitpunkt und Folge des Anwenders sowie Ergebnisse von Datenveränderungen protokolliert. Die Datenveränderungen werden vorteilhafterweise mit einem sogenannten Crawler überprüft.
Vorteilhafterweise erfolgt die Zusammenhangserfassung gewichtet. Dadurch ist die Dynamik der Erfassung von Zusammenhängen vorteilhafterweise weiter erhöhbar oder abschwächbar. In einer bevorzugten Ausgestaltung der Erfindung wird die Zusammenhangsgewichtung wenigstens eines bereits als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand erfassten Zusammenhangs in Abhängigkeit der Zusammenhangsgewichtung eines nachfolgend erfassten Zusammenhangs verändert, vorzugsweise wird die
Zusammenhangsgewichtung erhöht (inkrementiert) oder erniedrigt (dekrementiert). In einer besonders bevorzugten Ausgestaltung der Erfindung erfolgt die Gewichtung nicht nur nach einer prozentualen Treffergenauigkeit einer Suchanfrage, sondern anhand des von der erfindungsgemäßen Lösung durch dynamische Erfassung gebildeten semantischen Netzes, welches durch zahlreiche Parameter selbstständig und fortlaufend optimiert wird, insbesondere durch kontinuierliche Aktualisierung der erfassten Zusammenhänge. Details dieses iterativen, mehrere Bifurkationen umfassenden Prozesses ergeben sich insbesondere im Zusammenhang mit der unten noch folgenden Beschreibung der in den Figuren der Ausführungsbeispiele dargestellten Flussdiagramme, insbesondere aus Figur 14.
Vorteilhafterweise wird wenigstens ein erfasster Zusammenhang wiedergegeben, vorzugsweise seitens einer optischen und/oder akustischen Anzeigeeinrichtung des erfindungsgemäßen Datenverarbeitungssystems beziehungsweise einer erfindungsgemäßen Datenverarbeitungsvorrichtung. Gemäß einem weiteren vorteilhaften Vorschlag der Erfindung wird mit dem erfassten Zusammenhang dessen Gewichtung wiedergegeben.
In einer weiteren Ausgestaltung der Erfindung werden Gewichtungen mit einer Verfallszeit versehen, um Zusammenhänge in Abhängigkeit der Zeit abzuwerten. Da jeder Anwender die erfindungsgemäße Lösung unterschiedlich intensiv nutzen wird, ist es zweckmäßig für die Verfallszeit einen Zähler, der als kleinste Zeiteinheit eine Aktion verwendet, zu verwenden. Eine Aktion ist in diesem Fall, der Aufruf eines Inhaltes vorzugsweise einschließlich der Bearbeitung desselben und/oder dem Anlegen eines neuen Inhaltes vom Datenverarbeitungssystem aus. In einer weiteren Ausgestaltung der Erfindung findet die Zeitdauer, innerhalb der ein Anwender einen Zusammenhang genutzt hat, beispielsweise angeschaut hat, bei der Bestimmung der Verfallszeit Verwendung. Vorteilhafterweise verlängert sich die Verfallszeit einer Gewichtung eines Zusammenhangs, je länger und/oder häufiger der Anwender sich mit einem Inhalt beschäftigt hat, da dessen Bedeutung für den Anwender umso höher ist beziehungsweise sein muss.
Gegenstand der vorliegenden Erfindung ist ferner ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, welches ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen.
Eine weitere vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch eine graphische Benutzerschnittstelle zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen. Vorteilhafterweise ist die graphische Benutzerschnittstelle weiter zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet und/oder eingerichtet. Die Benutzerschnittstelle stellt vorteilhafterweise eine graphische Benutzeroberfläche bereit, die eine handlungsorientierte Navigation ermöglicht. Das heißt, dass an Stelle von ansonsten bei hierarchisch strukturierten Menüstrukturen dem Anwender zur Auswahl angebotenen möglichen Funktionen erfindungsgemäß Handlungsoptionen zur Auswahl angeboten werden, die im Kontext der Situation beziehungsweise aufgerufenen Inhalte sinnvoll ist beziehungsweise Sinn macht. Gemäß einem besonders bevorzugten Vorschlag der Erfindung nutzt die handlungsorientierte Navigation eine binäre Grundstruktur, die auf der einen Seite eine Eingabe von Inhalten und auf der anderen Seite eine Ausgabe von Inhalten ermöglicht. Vorteilhafterweise wird diese handlungsorientierte, binäre Navigation mit geräteübergreifender Gültigkeit, das heißt unabhängig von der jeweiligen Datenverarbeitungsvorrichtung realisiert.
In einer besonders bevorzugten Ausgestaltung der Erfindung teilt die graphische Benutzerschnittstelle den zur Wiedergabe seitens einer optischen Anzeigeeinrichtung zur Verfügung stehenden optischen Anzeigebereich in drei Bereiche auf, wobei in einem ersten Bereich das Ergebnis einer Selektion von Informationen repräsentierenden Daten, in einem zweiten Bereich mit einer Anzeige eine aus der Selektion im ersten Bereich ausgewählte Information und in einem dritten Bereich, der wenigstens eine Zusammenhang wiedergegeben wird. Die Wiedergabe der aus der Selektion im ersten Bereich ausgewählten Information im zweiten Bereich erfolgt vorzugsweise als Vorschau oder als Vollansicht der Information. Der Anzeigebereich kann dabei auch in Form eines Fensters seitens der Anzeigeeinrichtung bereitgestellt werden. Ein weiterer Vorschlag der Erfindung ist gekennzeichnet durch eine horizontale oder vertikale Aufteilung. Vorteilhafterweise ist die Größe der Bereiche ein- und/oder verstellbar.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung erfolgt die Wiedergabe zumindest teilweise in auswählbarer Form, das heißt die wiedergegebenen Zusammenhänge sind beispielsweise selbst als Menüpunkt für Handlungsoptionen und/oder als Verknüpfung nach Art eines Links ausgebildet, und durch Auswahl, beispielsweise durch sogenanntes "Anklicken", entsprechend nutzbar. Vorteilhafterweise werden Inhalte beziehungsweise Inhalte aufweisende Dokumente im Rahmen einer Vorschau seitens des Datenverarbeitungssystems wiedergegeben. Dadurch werden die Orientierungsmöglichkeiten für Anwender in den Zusammenhängen und den Inhalten weiter verbessert. Vorteilhafterweise ist die Vorschau während des Navigierens beziehungsweise der Steuerung durch Datenbestände wiedergebbar, so dass der Anwender einen schnellen Überblick über Zusammenhänge erlangen kann. Vorteilhafterweise enthält diese Vorschau eine Zusammenfassung des Inhaltes, beispielsweise eine hinsichtlich der dargestellten Elemente beziehungsweise Bestandteile reduzierte Internetseite oder einen zusammengefassten Text. Dadurch sind ansonsten gegebene Beschränkungen, die beispielsweise bei eine Vorschau auf Dokumente in Form von kleinen Bildern (sogenannte Thumbnails), in Form von Anfängen von Texten oder in Form von Programm- beziehungsweise Dokumentensymbolen (sogenannten Icons) gebenden Betriebssystemen gegeben sind, erfindungsgemäß beseitigbar.
In einer besonders bevorzugten Ausgestaltung der Erfindung wird das erfindungsgemäße Datenverarbeitungssystem, vorzugsweise im Rahmen einer auf einem Rechner laufenden Software, zur dynamischen Organisation von Informationen und/oder Prozessen eingesetzt.
Vorteilhafterweise ist das erfindungsgemäße Datenverarbeitungssystem Bestandteil einer Datenbankanwendung oder zumindest zusammen mit einer Datenbankanwendung nutzbar.
Gegenstand der vorliegenden Erfindung ist ferner eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines erfindungsgemäßen Datenverarbeitungssystems.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung wird eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, bereitgestellt, die gekennzeichnet ist durch eine Nutzung eines erfindungsgemäßen Datenverarbeitungssystems. In einer vorteilhaften Ausgestaltung der Erfindung ist die Datenverarbeitungsvorrichtung als mobiles Endgerät ausgebildet, vorzugsweise als ein in Mobilfunknetzen nutzbares beziehungsweise betreibbares mobiles Endgerät. Besonders bevorzugt ist eine Ausgestaltung der Datenverarbeitungsvorrichtung als Mobilfunktelefon.
Vorteilhafterweise ist das erfindungsgemäße Datenverarbeitungssystem derart ausgebildet, dass dieses mit einer Java VM lauffähig ist, so dass das Datenverarbeitungssystem prinzipiell auf allen mobilen Endgeräten nutzbar ist. In einer besonders bevorzugten Ausgestaltung der Erfindung unterstützt die Datenverarbeitungsvorrichtung dabei die besondere Ergonomie des Datenverarbeitungssystems.
Die erfindungsgemäße Lösung beinhaltet und realisiert in einer bevorzugten Ausgestaltung der Erfindung vorteilhafterweise die nachfolgenden Verfahren, Systeme und/oder Vorrichtungen zur Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten:
Basierend auf Erkenntnissen der Linguistik, der Epistemologie und der Neurologie, werden Zusammenhänge zwischen Inhalten (Informationen repräsentierenden Daten) erfasst, wobei die Zusammenhänge entsprechend neuronalen Mustern beziehungsweise Assoziationen im menschlichen Gehirn, dynamisch als modifizierbare, vorteilhafterweise verstärkbare oder abschwächbare, n-zu-n-Verknüpfungen (n: natürliche, ganze Zahi) erfasst werden.
So wie das menschliche Gehirn Reize seiner Sinnesorgane als mentale Präsentate zu mentalen Repräsentaten verdichtet beziehungsweise verarbeitet, beispielsweise leitet das menschliche Gehirn mittels des visuellen Wahrnehmungssystems aus synchron aktivierten Reizen ein bewegtes Objekt ab, werden bei der erfindungsgemäßen Lösung Zusammenhänge zwischen Inhalten (Informationen repräsentierenden Daten) erfasst. In Iterationsprozessen lassen sich auf Basis der dementsprechend erfassten dynamischen Zusammenhänge Informationen beziehungsweise Inhalte zu Wissen verdichten. Ferner sind die so erfassten Zusammenhänge erfindungsgemäß selbst in Form von Informationen repräsentierenden Daten als neuer Inhalt nutzbar, beispielsweise als Handlungsoptionen, die dem Anwender zur Auswahl angeboten werden oder im Rahmen automatisierter Abläufe in Prozesssteuerungen oder dergleichen einfließen. Vorteilhafterweise ist die erfindungsgemäße Lösung dabei pragmatisch und selbstorganisierend, so dass keine Konfigurationen durch den Anwender erforderlich sind. Dabei erlaubt die erfindungsgemäße Lösung dennoch offene Steuerungen durch den Anwender.
Vorteilhafterweise werden im Rahmen der Erfassung von Zusammenhängen verschiedene Methoden zum Herstellen, Modifizieren und Auflösen von dynamischen n- zu-n-Verknϋpfungen kombinativ miteinander angewendet, insbesondere Verknüpfungen durch manuelle Eingaben, Verknüpfungen durch syntaktische Vergleiche und/oder Verknüpfungen durch semantische Vergleiche. Ferner können mathematischstatistische Analyseverfahren zur Erfassung von Zusammenhängen Verwendung finden. Vorteilhafterweise werden die durch Verknüpfungen erfassten Zusammenhänge mit einer Gewichtung versehen. Die Gewichtung erfolgt dabei vorteilhafterweise mit Werten, vorzugsweise mit Werten zwischen 0 und 1 , entsprechend keinem Zusammenhang (Wert 0) oder einem unmittelbaren Zusammenhang (Wert 1 ).
Zusammenhangsverknüpfungen durch manuelle Eingaben seitens des Anwenders kann mit dem größtmöglichen Gewichtungswert, vorliegend 1 , versehen, dass heißt die Gewichtung der Verknüpfung bekommt den höchsten und fixen Wert Dabei findet insbesondere die nachfolgend noch näher beschriebene Ergonomie handlungsorientierter Logik Verwendung. Als Alternative kann ein kleinerer Wert gesetzt werden, um die Verknüpfung in das semantische Netz einfließen zu lassen.
Bei Zusammenhangsverknüpfungen durch syntaktische Vergleiche und/oder Regeln werden die Inhalte (Informationen repräsentierenden Daten) von Dateien und/oder Datenbanken oder definierte Teile von Inhalten als Datenbestand nach übereinstimmenden Worten, Wortbestandteilen beziehungsweise Zeichenketten durchsucht, die den Inhalten (Informationen repräsentierenden Daten) der Zusammenhangsanfrage entsprechen. Durch diese schnelle und valide Verknüpfung, die eine Art Grundgerüst für Zusammenhänge bereitstellt, wird die selbstständige Erfassung von Zusammenhängen, das sogenannte "Selbstlernen" der erfindungsgemäßen Lösung, beschleunigt.
Bei Zusammenhangsverknüpfungen durch semantische Vergleiche werden dynamische Zusammenhänge vorteilhafterweise anhand oder mittels der Folge von Inhalten (Informationen repräsentierende Daten) von Datenbeständen (Dateien und/oder Datenbanken) und/oder von Nutzungen von Inhalten (Informationen repräsentierende Daten) von Datenbeständen (Dateien und/oder Datenbanken) erfasst. Dabei nutzt die erfindungsgemäße Lösung vorteilhafterweise Erkenntnisse der impliziten Semantik. Als implizit wird die Semantik bezeichnet, weil diese vorliegend nicht explizit durch ein Begriffsnetz (Topic Map) oder semantischen Regeln der Linguistik modelliert wird, sondern nach der Erkenntnis, dass Zusammenhänge zwischen Inhalten wie Bedeutungen in einer Sprache nicht per definitionem entstehen, sondern dynamisch durch den Gebrauch derselben. So entstehen Bedeutungen einer Sprache dadurch, dass die Sprache verwendet wird und erfindungsgemäße Zusammenhänge zwischen Inhalten dadurch, dass diese Inhalte genutzt werden. Semantik ist insofern nicht von der Sprachpraxis beziehungsweise vorliegend von den Inhalten abstrahierbar.
In der technischen Realisierung von Zusammenhangsverknüpfungen durch semantisches Vergleichen erhält jede dynamische Verknüpfung systemintern einen Wert zwischen 0 und 1 , wobei der Wert 0 anzeigt, dass kein Zusammenhang besteht und der Wert 1 einen unmittelbaren Zusammenhang anzeigt, welcher beispielsweise manuell oder durch syntaktisches Vergleichen hergestellt wurde. Die erfindungsgemäße Lösung protokolliert alle Aktionen des Anwenders mit dem Datenverarbeitungssystem beziehungsweise die Folge aller aufgerufenen oder genutzten Inhalte, beispielsweise editierte Inhalte. Als Inhalte werden - wie bereits erläutert - Informationen repräsentierende Daten eines beliebigen Datenbestandes, beispielsweise einer Datei und/oder einer Datenbank, verstanden, die in beziehungsweise aus unterschiedlichen Datenformaten und aus unterschiedlichen Datenquellen stammen können.
Folgen zwei Inhalte aufeinander, entsteht eine latente Verknüpfung. Taucht diese Folge mehrfach auf wird die Verknüpfung verstärkt. Jede Verknüpfung ist vorteilhafterweise ferner zugleich mit einer Verfallszeit einer vorgebbaren Zeiteinheit versehen, wobei in einer Zeiteinheit der Wert einer Verknüpfung abgeschwächt wird und letztendlich nach mehreren Zeiteinheiten gegen den Wert 0 tendiert.
Über die unmittelbare Folge von zwei Inhalten hinaus sind seitens der erfindungsgemäßen Lösung vorteilhafterweise Gruppierungen von Inhaltsaufrufen, die ein Muster bilden, gegeben. Unter Muster wird dabei eine Folge von Inhaltsaufrufen verstanden, die unabhängig von ihrer Reihenfolge wiederkehren. Die Muster können von unterschiedlicher Größe beziehungsweise Zahl der Inhalte pro Folge sein und vorteilhafterweise ein sogenanntes Cluster bilden, welches über den Zusammenhang hinaus auf einer semantischen Metaebene ein Thema bildet. Ein solches Thema wäre wiederum beispielsweise als Zusammenhangsanfrage mit Hilfe eines syntaktischen Vergleichs zur Erfassung benennbar.
Ferner ist die erfindungsgemäße Lösung in der Lage, die Relevanz von erfassten Zusammenhängen für den jeweiligen Anwender durch den semantischen Vergleich zu bestimmen. Dadurch vermeidet die erfindungsgemäße Lösung eine übermäßige Informationsflut und ist in der Lage, Zusammenhangsanfragen des Anwenders präziser und fokussierter zu beantworten. Vorteilhafterweise kann die Relevanz von der erfindungsgemäßen Lösung ferner zu einer selbstorganisierenden Pflege des Datenverarbeitungssystem genutzt werden, beispielsweise um nicht genutzte, alte und/oder unwichtige beziehungsweise unwichtig gewordene Daten, die ansonsten das Datenverarbeitungssystem belasten würden, zu entfernen.
Bei Zusammenhangsverknüpfungen durch semantisches Vergleichen lassen sich durch entsprechende Ausgestaltung vorteilhafterweise Inhalte und/oder Nutzungen von Inhalten nach individuellen Interessen eines Anwenders analysieren, nachfolgend Interessen- beziehungsweise Aktionsanalyse genannt.
Bei einer Interessenanalyse wird untersucht welche Inhaltskategorien der Anwender vorzugsweise im Zusammenhang benötigt. Auf diese Weise trainiert die erfindungsgemäße Lösung die anwenderspezifischen Regeln für die syntaktische Analyse der Inhalte. Benötigt der Anwender beispielsweise Rechnungen und Aufträge wenn er einen Adresssatz aufruft, werden diese Beziehungen seitens des erfindungsgemäßen Datenverarbeitungssystems auch vorzugsweise angezeigt. Unter Inhaltskategorien versteht die erfindungsgemäße Lösung Inhalte, die formale Ähnlichkeit haben, beispielsweise elektronische Post (E-Mail), Adressen, Rechnungen, Aufträge, Projektplanungen, Termine, und/oder dergleichen. Wie bei semantischen Vergleichen werden die Ergebnisse der Interessenanalyse durch ein dynamisches Netz repräsentiert, dessen Beziehungen verstärkbar oder abschwächbar sind.
Durch diese Interessenanalyse lässt sich ein engerer Fokus auf die den Anwender interessierenden Inhalte, Nutzungen von Inhalten und/oder Aspekte eines Themas von Inhalten eingrenzen. Unter Thema ist dabei eine Gruppe von Inhalten zu verstehen, die - wie bereits erläutert - im Rahmen eines semantischen Vergleichs identifiziert und zusammengefasst wurden oder die sich aus einem abgefragten und erfassten Zusammenhang ergibt. Die Zusammenhangsanfrage kann dabei vorteilhafterweise auf unterschiedliche Art und Weise initiiert werden, beispielsweise durch dynamisch erfasste Nutzungen des Datenverarbeitungssystems durch den Anwender oder durch eine manuell oder - bei Integration einer Spracherkennung und natürlichsprachliche Interpretation seitens des erfindungsgemäßen Datenverarbeitungssystems - mündlich gestellte Zusammenhangsanfrage, beispielsweise in einem dafür vorgesehenen Suchfeld seitens einer graphischen Benutzerschnittstelle zur Steuerung des erfindungsgemäßen Datenverarbeitungssystems. Bei einer Aktionsanalyse wird untersucht welche Nutzungen von Inhalten der Anwender vorzugsweise im Zusammenhang benötigt. Es werden somit nicht die Inhalte, sondern die mit den Inhalten verbundenen Handlungen, die vorteilhafterweise zu Handlungsoptionen in Abhängigkeit von Variablen wie Inhalt, Inhaltstyp oder Thema seitens der erfindungsgemäßen Lösung aufbereitet werden, vernetzt erfasst. Für jeden aufgerufenen Inhalt oder eine Zusammenhangsanfrage ist die erfindungsgemäße Lösung in der Lage, dynamisch Handlungsoptionen anzubieten, die in dem jeweiligen Fall für den Anwender Sinn machen beziehungsweise aufgrund seiner üblichen Aktionsweise besonders wahrscheinlich sind. So macht es beispielsweise Sinn, dass in einem entsprechenden Datenverarbeitungssystem oder dergleichen Anwendung eine erstellte Rechnung verbucht wird oder auf eine E-Mail eine Antwort erfolgen kann.
Bei einer vorteilhaften Analyse nach Mustern in den Inhalten und/oder deren Nutzungen wird vorliegend vorteilhafterweise ein sogenannter Pattern Analyzer verwendet, ein Prozess, welcher in unstrukturierten Inhalten nach Mustern, die er als eigenständigen Inhalt erkennt oder für eine Zusammenfassung von Inhalten nutzt, sucht.
So erkennt der sogenannte Pattern Analyzer beispielsweise eine Adresse oder ein Bild im Text und kann diese Informationen nutzen, um Sie als eigenständigen Inhalt verfügbar zu machen. Internetseiten können auf diese weise zu einer automatisierten Addressrecherche genutzt werden. Damit greift der Pattern Analyzer vorteilhafterweise die Konzepte der beschriebenen erfindungsgemäßen semantischen Analyse auf. Vorteühafterweise werden ausgewählte Inhalte, beispielsweise E-Mails, automatisiert ausgewertet und als strukturierte Information bereitgestellt.
Wie oben bereits erläutert überprüft der Analyzer im Anschluss an die semantische Analyse, ob es nun Verknüpfungen zwischen den Links gibt und ob ein Meta-Link etabliert werden kann.
Für die Erstellung von Metainhalten beziehungsweise für die Identifikation von Themen überprüft der Semantic Analyzer zunächst wie viele Links zu einem Inhalt bestehen. Ist eine kritische Zahl, die dynamisch definierbar ist, erreicht und existiert noch kein Metainhalt, der die Menge der Links des vom Analyzer untersuchten Inhaltes als Teilmenge seiner Links enthält, wird ein neuer Metainhalt erstellt. Dafür werden die einzelnen Inhalte zusammengeführt und zusammengeführt. Das kann vorteilhafterweise mit dem Pattern Analyzer oder anderen Analyseverfahren beziehungsweise -methoden erfolgen. Existiert ein Thema und wird die kritische Zahl der Verknüpfungen unterschritten, wird der Metainhalt gelöscht. Metainhalte können vorteilhafterweise über ein entsprechendes Plug-in verwaltet werden.
Die erfindungsgemäße Lösung ist prinzipiell in der Lage, unbegrenzte Datenbestände in Form von Dateien und/oder Datenbanken unterschiedlicher Formate und aus verschiedenen Datenquellen in das Datenverarbeitungssystem einzubinden. Dabei sollen die Datenquellen weder importiert noch verändert werden, um vorteilhafterweise in ihrem ursprünglichen Systemkontext funktionsfähig und nutzbar zu bleiben. Das dient der Investitionssicherheit und beschleunigt beziehungsweise unterstützt ferner eine Implementierung der erfindungsgemäßen Lösung. Dazu weist das erfindungsgemäße Datenverarbeitungssystem vorteilhafterweise eine zentrale Datenverwaltung - nachfolgend "Repository" genannt - auf, welche Verweise auf die verschiedenen Datenbestände und Datenquellen enthält. Dabei werden nicht die kompletten Inhalte gespeichert, sondern nur Verweise zu den jeweiligen Daten. Dadurch kann eine doppelte Datenhaltung vermieden werden.
Wie bereits erläutert, ist die erfindungsgemäße Lösung in der Lage, Informationen repräsentierende Daten als Inhalte aus verschiedenen Datenbeständen sowohl Datenbanken als auch Dateien, in unterschiedlichen Formaten aus unterschiedlichsten Datenquellen, beispielsweise über das Internet oder ein lokales Firmennetzwerk, zu integrieren, deren Struktur zu identifizieren und die ermittelten Zusammenhänge der Inhalte beziehungsweise Inhaltsbestandteile, beispielsweise den Absender einer E-Mail zu identifizieren. Dabei werden die einzelnen Inhaltsbestandteile vorteilhafterweise in Beziehung zu korrespondierenden Inhaltsbestandteilen anderer Inhalte gesetzt. Durch diese Maßnahme wird die erfindungsgemäße Lösung beim Durchsuchen von Inhalten von Datenbeständen - insbesondere auch Volltexten - nach Worten, Wortbestandteilen und/oder Zeichenketten beschleunigt.
Dieser Prozess des Durchsuchens von Inhalten von Datenbeständen nach Worten, Wortbestandteilen und/oder Zeichenketten - nachfolgend auch "Crawler" genannt - wird vorteilhafterweise im Hintergrund der Anwendung der erfindungsgemäßen Lösung seitens eines erfindungsgemäßen Datenverarbeitungssystems ausgeführt und sucht in periodischen Abständen nach neuen und veränderten Inhalten, die für die Analyse vorzugsweise in temporären Dateien zwischengespeichert werden. Sobald die Analyse abgeschlossen ist, werden die temporären Daten wieder gelöscht. Weitere Einzelheiten, Merkmale und Vorteile der Erfindung werden nachfolgend anhand der Beschreibung der in den Figuren der Zeichnung dargestellten Ausführungsbeispiele näher erläutert. Dabei zeigen:
Fig. 1 in einem Blockdiagramm die prinzipiellen Komponenten eines erfindungsgemäßen Datenverarbeitungssystems;
Fig. 2 ein prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 3 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen Datenverarbeitungssystems nach Fig. 1 ;
Fig. 4 ein weiteres prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 5 in einem Blockdiagramm ein prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindυngsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 6 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 7 prinzipielle Details der Kommunikation nach Fig. 6;
Fig. 8 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 9 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 10 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen
Datenverarbeitungssystems nach Fig. 1 ;
Fig. 11 in einem Flussdiagramm ein Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 12 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 13 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 14 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 15 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 16 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;
Fig. 17 in einer schematischen Darstellung ein prinzipielles Ausführungsbeispiel einer erfindungsgemäßen graphischen Benutzerschnittstelle zur Nutzung eines erfindungsgemäßen Datenverarbeitungssystems;
Fig. 18 in einer schematischen Darstellung ein weiteres prinzipielles Ausführungsbeispiel einer erfindungsgemäßen graphischen
Benutzerschnittstelle zur Nutzung eines erfindungsgemäßen Datenverarbeitungssystems;
Fig. 19 in einem Flussdiagramm ein Ausführungsbeispiel für eine erfindungsgemäße Kontextsuche im Rahmen einer erfindungsgemäßen
Zusammenhangserfassung und Fig. 20 in einem Flussdiagramm ein Ausführungsbeispiel für eine erfindungsgemäße ontologische Zusammenhangserfassung im Rahmen einer erfindungsgemäßen Zusammenhangserfassung.
Dass eine erfindungsgemäßes Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten realisierende Hardware- beziehungsweise Softwarekonzept einschließlich der Benutzerführung ergibt sich insbesondere aus der erfindungsgemäßen kontextsensitiven Verwaltung von Informationen und/oder Aktionen derart, dass ein belegbarer Zusammenhang gegeben ist.
Das Datenverarbeitungssystem besteht aus mehreren Komponenten, die ihrerseits wieder weitere Subkomponenten enthalten. Im Zusammenhang mit den Figuren 1 bis 13 werden nachfolgend die jeweiligen Hauptkomponenten für einen allgemeinen Überblick über die Architektur des Datenverarbeitungssystems beschrieben. Hintergrund der hier dargestellten und beschriebenen Architektur ist, dass die Komponenten nicht zwingend innerhalb einer Anwendung ausgeführt werden müssen, sondern auch eine Aufteilung in verschiedenen Anwendungen und Systemen möglich ist. Dadurch wird sowohl eine sogenannte Standalone- als auch eine sogenannte Client/Server-Anwendung unterstützt.
Wie anhand von Fig. 1 zu erkennen, weist das Datenverarbeitungssystem eine Benutzeroberfläche, einen Kernel und ein sogenanntes Repository auf.
Die Benutzeroberfläche (nachfolgend GUI genannt) ist die Schnittstelle zum Anwender. Die Benutzeroberfläche (GUI) ist dabei derart realisiert und gestaltet, αass die ergonomischen Bedürfnisse des Benutzers beziehungsweise Anwenders vollständig erfüllt werden. Vorliegend ist die Benutzeroberfläche (GUI) plattform- beziehungsweise geräteabhängig und wird dementsprechend für jede Plattform beziehungsweise Datenverarbeitungsvorrichtung an deren Fähigkeiten individuell angepasst. Vorliegend sind beispielsweise Implementierungen der Benutzeroberfläche (GUI) für PC's, PDA's, Web- beziehungsweise HTML-Anwendungen, Mobilfunktelefon- beziehungsweise WML/WAP-Anwendungen vorgesehen, die vorzugsweise mittels oder als JAVA- Anwendungen realisiert werden.
Der Kernel ist der zentrale Applikationskern des Datenverarbeitungssystems, in dem sämtliche Komponenten zusammenlaufen und miteinander verbunden werden. Der Kernel selbst unterteilt sich in weitere Subkomponenten, nachfolgend IQser, Content Provider, Crawler, Logger beziehungsweise Tracker (in Fig. 1 nicht explizit dargestellt) und Analyzer genannt.
Der Kernel stellt eine Schnittstelle zur graphischen Benutzeroberfläche (GUI) bereit, die nachfolgend IQser-Komponente genannt wird. Dabei werden die jeweiligen Methoden- Aufrufe der Benutzeroberfläche (GUI) an die jeweils zuständigen Komponenten weitergeleitet und bei Bedarf vor der Rückgabe zur Benutzeroberfläche (GUI) entsprechend aufbereitet, wie anhand des in Fig. 2 dargestellten Prinzips ersichtlich. Das Ausführen der jeweils angeforderten Aufgaben gemäß Fig. 2 wird von den dazu jeweils vorgesehenen Komponenten vorgenommen. Fig. 3 gibt einen beispielhaften Überblick über die Verbindungen der einzelnen Komponenten untereinander.
Des weiteren ist die IQser-Komponente die Controller-Instanz, die die Zugriffe auf das Repository beziehungsweise die Repositories regelt sowie die Crawler- und Analyzer- Prozesse steuert. Ferner realisiert die IQser-Komponente vorliegend die Aufgabe, die jeweiligen Content Provider in das System zu integrieren.
Die Komponente Content Provider ist ein abstrakte Komponente. Es handelt sich vorliegend um ein Framework, dass es ermöglicht jede beliebige Datenquelle in das Datenverarbeitungssystem zu integrieren. Dadurch wird das Gesamtsystem sehr flexibel und lässt sich in die bestehende Infrastruktur des Anwenders einbinden.
Die Crawier-Komponente hat die Aufgabe nach neuen Content-Objekten oder nach Änderungen an bestehenden Objekten zu suchen. Alle Änderungen und Neuerungen werden im Repository synchronisiert, so dass das Repository immer auf dem aktuellen Stand ist. Der von der Crawler-Komponente realisierte Prozess läuft dabei im Hintergrund und wird über ein frei definierbares Intervall gestartet.
Aufgabe der in Fig. 1 nicht explizit dargestellten Logger- beziehungsweise Tracker- Komponente ist es, jede Aktivität des Anwenders mit einem Inhalt (nachfolgend auch Content-Objekt genannt) zu protokollieren. Diese Protokollierung wird benötigt, um im Analyzer später bestimmte Bearbeitungs- beziehungsweise Nutzungsmuster des Anwenders in Beziehung zu verschiedenen Content-Objekten zu erfassen und gegebenenfalls weniger relevante Zusammenhänge (sogenannte „weak links") zwischen Objekten zu erstellen oder zu löschen.
Die Analyzer-Komponente läuft vorliegend als eigenständiger Prozess im Hintergrund des Datenverarbeitungssystems und übernimmt mehrere Aufgaben. Für einen semantischen Vergleich durchsucht die Analyzer-Komponente von der Loggerbeziehungsweise Tracker-Komponente protokollierte Aktivitäten beziehungsweise Nutzungen des Anwenders nach Mustern und erzeugt beziehungsweise löscht die genannten Zusammenhänge im Repository. Dadurch kann das Datenverarbeitungssystem dynamisch Zusammenhänge zwischen Inhalten und deren Nutzungen selbstständig erkennen und quasi erlernen. Bei syntaktischen Vergleichen vergleicht die Analyzer-Komponente den tatsächlichen Inhalt eines Datenbestandes (Content-Objekt) auf Textfragmente, die auf andere Datenbestände (Content-Objekte) hinweisen.
Das Datenverarbeitungssystem verweist auf fremde Datenbestände und nutzt diese zur Zusammenhangserfassung. Das können Einträge in fremden Datenbanken sein, zum Beispiel E-Mails oder Adressen, aber auch Dokumente und Objekte des Datenverarbeitungssystems selbst. Folgt der Anwender einem Zusammenhangsverweis öffnet sich der Datensatz oder das externe Dokument in der dafür passenden Applikation. Greift der Anwender über Netzwerkverbindungen auf einen Datenbestand zu, öffnet sich das Dokument beispielsweise in einem zusätzlichen Browserfenster, nachdem es vorher entsprechend von dem Datenverarbeitungssystem konvertiert wurde.
Das Repository ist die Schnittstelle zur Datenhaltung. Hier werden Zusammenhänge und/oder Verweise auf die Datenbestände (Content-Objekte) und deren jeweiligen Verknüpfungen verwaitet. in Fig. 1 ist exemplarisch nur ein Repository dargestellt. Es sind jedoch auch mehrere Repositories in das Datenverarbeitungssystem einbindbar, so dass beispielsweise lokale, serverbasierte Zusammenhänge und Datenbestände in das jeweilige Anwendersystem integriert werden können.
Das Datenverarbeitungssystem weist weiter eine Schnittstelle zur Integration von Datenbeständen auf, um jede erdenkliche Art von Inhalten in Form von Informationen repräsentierenden Daten verarbeiten zu können. Da in der Regel nicht von vornherein alle Möglichkeiten und Arten einer Integration von Datenbeständen vorgebbar sind, ist der Content-Provider-Komponente vorliegend als programmierbare Schnittstelle implementiert. Dadurch wird es Entwicklern ermöglicht weitere Content-Provider individuell zu programmieren, die dann von dem Datenverarbeitungssystem verwendet werden können. Diese Programmierschnittstelle wird nachfolgend auch Plug-in genannt und ist in Fig. 4 dargestellt. Das Plug-in (Fig. 4) besteht aus mehreren Objekten, die vom Entwickler zu implementieren sind:
- ContentProvider: Das ist die Schnittstelle zum Kernel und bietet die Methoden, die für die Verarbeitung von Inhalten notwendig sind.
- Content: Das Content-Objekt ist der eigentliche Inhalt. Es wird dazu verwendet um die Inhalte zwischen den Komponenten auszutauschen.
- ContentView: Die Schnittstelle zur GUI. Hiermit werden die Darstellung und die möglichen Aktionen beziehungsweise Nutzungen der Inhalte implementiert.
Wie anhand von Fig. 5 zu erkennen ist, werden Plug-ins (Plugins) von zwei Objekten verwaltet, dem PluginManager und dem Plugin. Der PluginManager hat die Aufgabe, bei Start der IQser-Komponente des Datenverarbeitungssystems nach installierten Plugins zu suchen, vorhandene Plugins zu laden und zu initialisieren. Das Plugin selbst wird dabei vorliegend als Datencontainer verwendet. Es enthält eine Instanz des ContentProviders und die Konfiguration des jeweiligen Plugins.
Für die Entwicklung eines neuen Plugins sind vom Entwickler die Objekte ContentProvider, Content und ContentView zu implementieren. Die Konfiguration eines Plugins erfolgt über eine Datei (vorliegend plugin.xml), die im jeweiligen Plugin- Verzeichnis vorhanden sein muss. Fehlt sie, wird das Verzeichnis von der vorliegend als IQser bezeichneten Komponente des Datenverarbeitungssystems nicht als Plugin übernommen.
In Fig. 6 sind beispielhaft die von der Crawler-Komponente realisierten Prozesse, die im Hintergrund der Anwendung des Datenverarbeitungssystems ablaufen dargestellt. Dabei werden die Datenbestände nach neuen und veränderten Inhalten durchsucht und diese beispielsweise in Form einer Tabelle zur Analyse gespeichert. Die Prozesse werden dabei vorliegend mit einer niedrigen Priorität in periodischen Abständen ausgeführt.
Wie anhand der Darstellung in Fig. 7 zu erkennen ist, holt sich der sogenannte Crawler vom PluginManager die Liste der installierten Plugins und arbeitet diese sukzessive ab. Jeder ContentProvider eines Plugins wird dabei nach neuen oder geänderten Content- Objekten abgefragt. Der ContentProvider liefert jeweils eine Liste mit Content-Ids zurück. Diese Listen werden vom Crawler dann in einer Cache-Tabelle gespeichert. Die Tabelle wird von den Analyzem dann wiederum abgearbeitet.
Die Aufgabe der sogenannten, in Fig. 8 beispielhaft dargestellten Loggerbeziehungsweise Tracker-Komponente ist ähnlich der der Crawler-Komponente. Der Tracker beziehungsweise Logger protokolliert die Aktionen des Anwenders zu Content- Objekten. Durch diese Protokollierung werden später durch den InterestAnalyzer Muster in der Bearbeitung und/oder Nutzung von Inhalten erfasst und einer weiteren Nutzung zugeführt. So können Zusammenhänge zwischen Inhalten dynamisch erzeugt werden. Diese Zusammenhänge werden niedrig gewichtet und werden, sobald sie für einen längeren, vorgebbaren Zeitraum nicht verwendet wurden, durch Freigabe quasi wieder vergessen. Der Zeitraum, über den der Tracker beziehungsweise Logger die Aktivitäten protokollieren soll, ist konfigurierbar. Je geringer der Zeitraum, umso schneller ist auch die Verarbeitung. Je länger der Zeitraum, umso höher ist die Möglichkeit Bearbeitungs- beziehungsweise Nutzungsmuster zu erfassen.
Der in Fig. 9 dargestellte Analyzer ist ein Prozess der im Hintergrund des Datenverarbeitungssystems die vom Crawler „gefundenen" Inhalte nach verschiedenen Kriterien analysiert. Der Analyzer selbst besteht vorliegend wiederum aus nachfolgenden Unterkomponenten beziehungsweise -prozessen:
- IndexAnalyzer: Analysiert die Inhalte nach Stichworten: die für die Zusammenhangserfassung notwendig sind.
- SemanticAnalyzer: Analysiert die Inhalte nach semantischen Kriterien um Verbindungen zwischen Inhalten zu erfassen.
- SyntaxAnalyzer: Analysiert die Inhalte auf syntaktische Verbindungen zu anderen Inhalten.
- InterestAnalyzer: Analysiert Inhalte nach Mustern in der Bearbeitung beziehungsweise der Nutzung durch den Anwender.
Wurden mindestens zwei Ereignisse im Protokoll (Tracker) eingetragen, kann eine Analyse mit dem Aufruf des Analyseprozesses beginnen. Dafür betrachtet der Analyzer die ersten beiden Einträge des Protokolls. Handelt es sich beim zweiten Eintrag nicht um ein Ereignis, dass durch die Auswahl (zum Beispiel: „zur Anzeige") eines Inhaltes ausgelöst wurde, startet die Syntaxanalyse (vgl. Fig. 11 ). Handelte es sich um einen Zusammenhang (nachfolgend auch Selektion genannt), wird die Syntaxanalyse übersprungen. Handelt es sich bei beiden Einträgen um ein Ereignis, das durch den Anwender ausgelöst wurde, werden beide Inhalte vorliegend jeweils im Semantik- und Interest-Analyser und untersucht. Anschließend können weitere Analyseschritte folgen. Sind alle Analyseschritte durchgeführt, wird der erste Eintrag gelöscht. Nun wiederholt sich der gesamte Prozess bis nur noch ein Eintrag im Protokoll vorhanden ist.
In Fig. 14 ist dazu beispielsweise der Prozess eines sogenannten Metaanalyzers dargestellt. Der Metaanalyzer überprüft, ob die Zahl der Verknüpfungen zu einem untersuchten Inhalt einen Grenzwert n überschreitet. Wenn nicht, wird überprüft, ob es einen Meta-Inhalt gibt, der - wenn er existiert - gelöscht werden muss. Ist der Grenzwert erreicht, wird zunächst auch überprüft, ob es einen Metainhalt gibt. In beiden Fällen werden alle verknüpften Inhalte zusammengeführt und zusammengefasst. Gab es schon einen Metainhalt, wird dieser durch die Zusammenfassung aktualisiert. Gab es noch keinen Metainhalt, wird ein solcher erstellt und in einer Datenbank hinterlegt.
Das in Fig. 10 beispielhaft im Detail dargestellte Repository ist die Schnittstelle zu den Datenbeständen. Es übernimmt die Speicherung aller für den Kernel relevanten Daten, vorliegend sind dies insbesondere:
- Ein Index zu allen Inhalten.
- Zusammenhänge beziehungsweise Verknüpfungen von Inhalten zu anderen Inhalten.
- Temporäre Informationen zur Reihenfolge von der Bearbeitung von Inhalten durch den Anwender (Tracker).
- Temporäre Informationen zu neuen und veränderten Inhalten (Crawler).
- Ein Index über alle Schlüsselwerte der Inhalte (Gewichtung).
Beim Start der Semantik-Analyse wird überprüft, ob es bereits eine Verknüpfung zwischen den beiden Inhalten gibt. Gibt es keine wird eine Verknüpfung mit einem niedrigen Wert größer 0 für die Gewichtung erstellt. Gibt es bereits eine Verknüpfung fragt der SemanticAnalyzer, ob die Gewichtung kleiner 1 ist. Ist dieser Wert 1 , wird die Analyse abgebrochen, ist sie kleiner 1 , wird sie fortgesetzt. Nun wird die Gewichtung der Verknüpfung um einen kleinsten Wert größer 0 erhöht. Im Anschluss daran wird überprüft, ob die resultierende Gewichtung größer oder gleich 1 ist. Ist der Wert kleiner 1 ist die Semantik Analyse beendet. Ist der Wert größer oder gleich 1 , wird die Gewichtung auf einen größten Wert kleiner 1 herabgesetzt. Im Anschluss daran werden alle weiteren bestehenden Verknüpfungen aufgerufen und deren Gewichtung um einen Faktor herabgesetzt, der der Herabsetzung der aktuell untersuchten Verknüpfung entspricht. Der SemanticAnalyzer wird anschließend beendet.
Fig. 11 zeigt den iterativen Analyseprozess der Zusammenhangserfassung. Dabei werden vorliegend - wie bereits erläutert - verschiedene Analyseprozesse kombinativ angewandt. Im Rahmen der Zusammenhangserfassung wird der Analyseprozess von einem Eintrag im Tracker (Ereignisprotokoll) gestartet und ist beendet, wenn nur ein Eintrag im Tracker verbleibt. Wie oben bereits erläutert, hat die Analyzer-Komponente die Aufgabe, die Zusammenhänge zwischen den Inhalten selbstständig zu erkennen. Dafür verwendet das Datenverarbeitungssystem kombinativ insbesondere eine syntaktische und semantische Analyse. Fig. 12 zeigt den Ablauf der oben bereits erläuterten Prozesse im Rahmen einer semantischen Analyse. Fig. 13 zeigt die prinzipielle Struktur der Prozesse im Rahmen einer syntaktischen Analyse.
In Fig. 11 sind die prinzipiellen von der Analyzer-Komponente realisierten Verfahrensschritte dargestellt. Im Rahmen des Aufrufs der Analyzer-Komponente werden Logfiles oder die Datenbankeinträge (Logs) nach der zeitlichen Folge, in der die einzelnen Positionen geschrieben wurden abgearbeitet. Wurden auf diese Weise Einträge abgearbeitet, werden diese aus der Liste gelöscht, wobei jedoch wenigstens die letzte Aktion gespeichert bleibt . Wie lang die Liste der Aktionen im Logfile beziehungsweise der Datenbanktabelle ist, richtet sich also danach, wie schnell der Analyzer arbeitet beziehungsweise wie viel Rechnerleistung dem sekundären Thread zugewiesen wird. Priorität hat immer der Thread der IQser-Komponente beziehungsweise die Aktionen, die der Anwender des Datenverarbeitungssystems durchführt. Sobald eine neue Aktion im Logfile geschrieben wird und der Analyzer noch nicht aktiv war, beginnt die Analyse zur Zusammenhangserfassung. Folgende Situationen können dabei zum Aufruf des Analyzers führen:
- Beim Start des Datenverarbeitungssystems sind bereits mindestens zwei Einträge aus der letzten Session im Log.
- Der Crawler hat neue Inhalte identifiziert, beispielsweise durch ein neues Plugin.
- Der Anwender erzeugt einen neuen Inhalt. - Der Anwender wählt einen Inhalt aus einer aufgerufenen Liste.
Der SyntaxAnalyzer ermittelt die Regeln für die Syntax-Analyse durch den Aufruf der „Schlüssel" (Keys) für den jeweils zu untersuchenden Inhalt. Jene "Schlüssel" sind Attribute, die beschreiben, welche Informationsbausteine (Datenfelder) und Datentypen für die Ermittlung von Sinnzusammenhängen genutzt werden sollen. Aus den Keys stellt der Analyzer einen Filter zusammen, der eine Suche über den insgesamt erfassten Datenbestand auslöst. Zu den gefundenen Inhalten wird schließlich eine Verknüpfung hergestellt, die in Abhängigkeit von der Implementierung und den Anforderungen des Anwenders mit 1 oder einem größten Wert kleiner 1 oder der Treffergenauigkeit gewichtet wird.
Wie bereits erläutert, können alle Inhalte mit beliebigen und beliebig vielen anderen Inhalten in Zusammenhängen verknüpft werden. Zusammenhänge sind sowohl kategorieübergreifend als auch innerhalb einer Kategorie möglich. Zum Beispiel lassen sich Adressen mit Adressen aber auch Adressen mit Projekten verknüpfen. Eine hierarchische Ordnung gibt es nicht. Das Datenverarbeitungssystem unterscheidet statische und dynamische Verknüpfungen für Zusammenhänge beziehungsweise deren Erfassung. Statische Verknüpfungen werden immer angezeigt und können vom Anwender hergestellt und bearbeitet werden. Dynamische Verknüpfungen stellt das System mit einer Gewichtung automatisch her. Als Kriterien der Gewichtung dienen:
- Die Häufigkeit des Aufrufs eines Inhaltes.
- Die Häufigkeit des Aufrufs von Inhalten in dem von dem Zusammenhang hergestellten Kontext.
- Das Alter des letzten Aufrufs des Zusammenhangs oder der verknüpften Inhalte.
Bei Suchergebnissen einer Zusammenhangsanfrage gibt es darüber hinaus eine Gewichtung nach der Häufigkeit des gesuchten Inhaltes im jeweiligen Zusammenhang.
Es gibt - wie bereits erläutert - einen internen Schwellenwert, nach dem eine dynamische Verknüpfung angezeigt wird oder nicht. Der Wert (Gewichtung) ändert sich in Abhängigkeit des Benutzerverhaltens beziehungsweise der Auswertung des Protokolls aller Aktionen, die der Anwender mit dem Datenverarbeitungssystem durchführt. Im Datenverarbeitungssystem werden die Zusammenhänge als dynamisch verknüpfte Objekte abgebildet.
Fig. 15 zeigt und beschreibt exemplarisch wie für die Identifizierung neuer Inhalte das entsprechende Plug-in nach einem Crawler Task abgefragt wird. Technisch gesehen handelt es sich bei diesem Synchronisationsprozesse realisierenden Teilsystem um eine sogenannte Klasse, die die jeweiligen Datenquellen des Plug-ins nach neuen, gelöschten oder generierten Zusammenhängen abfragt.
Fig. 16 zeigt und beschreibt exemplarisch den Ablauf einer erfindungsgemäßen Analyse von Volltexten im Rahmen einer erfindungsgemäßen Zusammenhangserfassung, wobei wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird. Die bei der Musteranalyse aus einem Volltext erstellte Wortliste wird aufsteigend nach der Häufigkeit der Worte sortiert. Die ersten 32 Worte der daraus entstehenden Liste wird als Suchanfrage - das heißt als Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) - an einen Volltextindex einer Suchmaschine gestellt. Als Ergebnis wird eine Liste der ähnlichen Dokumente mit einer aus der Suchmaschine ermittelten Gewichtung geliefert. Anschließend wird in der weiteren Analyse jeweils geprüft, ob bereits eine Verknüpfung des Volltextes zum Suchtreffer gibt. Ist das der Fall wird die höhere Gewichtung übernommen, ist das nicht der Fall wird eine Verknüpfung hergestellt und die Gewichtung des Suchergebnisses übernommen.
Das erfindungsgemäße Datenverarbeitungssystem stellt ferner eine geräteübergreifende Mensch-Maschine-Schnittstelle für die Anzeige, Bearbeitung und Steuerung komplexer Inhalte beziehungsweise Datenbestände und deren Zusammenhänge bereit, insbesondere um den Anforderungen hinsichtlich einer transparenten Steuerung zur Modifikation von großen Datenbeständen und deren Zusammenhängen zu genügen und eine solche insbesondere für den ungeschulten Anwender verständlich und im Vergleich zu anderen Systemen einfacher zu machen. Vorteilhafterweise sind die von der Mensch-Maschine-Schnittstelle genutzte Logik und Ergonomie unabhängig von den für oder mit dem erfindungsgemäßen Datenverarbeitungssystem genutzten Datenverarbeitungsvorrichtungen oder Datenverarbeitungsendgeräten, beispielsweise deren Ausgabeeinheiten wie Monitore oder Displays. Vorteilhafterweise wird mit der Mensch-Maschine-Schnittstelle des erfindungsgemäßen Datenverarbeitungssystems eine handlungsorientierte Steuerung des Datenverarbeitungssystems ermöglicht. Die erfindungsgemäße handlungsorientierte Steuerung des Datenverarbeitungssystems ersetzt die heute in der Regel eingesetzte funktionale Menüsteuerung rechnergestützter Programme. Eine funktionale Menüsteuerung bietet eine Auswahl von Funktionen, die nach abstrakten Kriterien gruppiert und in Menübäumen zugänglich sind. Solche abstrakten Kriterien sind zum Beispiel „Datei" und „Bearbeiten" für die Windows-Betriebssysteme der Firma Microsoft. Demgegenüber arbeitet die erfindungsgemäße handlungsorientierte Steuerung - auch handlungsorientierte . Navigation genannt - mit kontextsensitiven Handlungsoptionen, die in jeder Anwendungssituation des Systems binär strukturiert sind. Die binäre Struktur bezieht sich auf eine Eingabe auf der einen und eine Ausgabe von Inhalten auf der anderen Seite, beziehungsweise auf das Verfassen oder Verändern und das Anzeigen von Datenbeständen. Vorteilhafterweise werden die binären Handlungsoptionen in Abhängigkeit des jeweiligen Handlungskontextes angepasst, das heißt es können in Abhängigkeit des jeweiligen Handlungskontextes neue Handlungsoptionen hinzukommen und/oder andere Handlungsoptionen wegfallen. Vorteilhafterweise lässt sich die binäre handlungsorientierte Steuerung so zugleich auf alle Ausgabemedien anwenden, beispielsweise bei kleine Displays mobiler Endgeräte oder bei einer Spracheingabe und/oder -ausgäbe, wozu die Datenverarbeitungsvorrichtung dann vorteilhafterweise Mikrofon und Lautsprecher als Ein- und Ausgabeeinheiten aufweist.
Die Steuerung beziehungsweise Navigation durch komplexe Datenbestände und deren Zusammenhänge realisiert die Mensch-Maschine-Schnittstelle des erfindungsgemäßen Datenverarbeitungssystems vorteilhafterweise mit einer graphischen Benutzerschnittstelle die zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen dient. Die graphische Benutzerschnittstelle ist dabei zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet.
Die graphische Benutzerschnittstelle teilt den zur Wiedergabe seitens einer Anzeigeeinrichtung zur Verfügung stehenden Anzeigebereich in drei Bereiche, wobei in einem ersten Bereich Informationen repräsentierende Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, in einem zweiten Bereich wenigstens ein wenigstens eine Information repräsentierendes Datum einer Zusammenhangsanfrage und in einem dritten Bereich wenigstens ein erfasster Zusammenhang zwischen dem wenigstens eine Information repräsentierenden Datum der Zusammenhangsanfrage und dem wenigstens eine Information repräsentierenden Datum des Datenbestandes wiedergegeben wird.
Die erfindungsgemäße Aufteilung des Anzeigebereichs in drei Teilbereiche wird nachfolgend triadische Fenstertechnik genannt. Während die aus den grafischen Oberflächen moderner Betriebssysteme bekannten Fenstertechniken entweder mit Listen-, Icon- oder Baumdiagrammen zur Darstellung der hierarchischen Struktur der Daten und Dateien eines Computersystems arbeiten, arbeitet die erfindungsgemäße triadische Fenstertechnik mit einer horizontalen oder vertikalen Dreiteilung des zur Verfügung stehenden Anzeigebereichs (Fensters).
In Fig. 17 und Fig. 18 ist jeweils eine entsprechende graphische Benutzerschnittstelle dargestellt. Vorliegend in Form eines prinzipielles Beispiels eines sogenannten Intemet- Frontends, mit einer vertikalen Aufteilung des Anzeigebereichs. Dabei ist das erfindungsgemäße Datenverarbeitungssystem in Form eines sogenannten Webbrowsers (Fig. 17) oder eines sogenannten JAVA-Clients (Fig. 18) nutzbar.
Bei der in Fig. 17 und Fig. 18 dargestellten vertikalen Aufteilung des Anzeigebereichs befindet sich beispielsweise im oberen Drittel des Anzeigebereichs (Fensters) eine Auswahl von Inhalten als tabellarisch dargestellte Liste, im zweiten Drittel des Anzeigebereichs (Fensters) eine Detailansicht eines aus der ersten Liste ausgewählten Inhaltes und in dem letzten Drittel des Anzeigebereichs (Fensters) sämtliche mit der Auswahl verknüpften Inhalte, die beispielsweise ebenfalls in einer Liste erscheinen beziehungsweise wiedergegeben werden. Der Anwender sieht so auf einem Blick welche Inhalte zusammengehören und kann von dort gleich weiternavigieren, um Inhalte zu suchen oder aus den Zusammenhängen Erkenntnisse abzuleiten. Die Epistemologie zeigt, dass Wissen durch Verknüpfung von Information entsteht. Das erfindungsgemäße Datenverarbeitungssystem macht somit nicht nur Informationen transparent sondern auch Wissen. Wählt der Anwender einen Inhalt aus der Liste im letzten Drittel des Fensters, wird vorteilhafterweise eine Animation gestartet, die die letzte Animation nach oben schiebt, wobei das anschließend zu sehende "triadische Fenster" den gleichen Aufbau und gleiche Logik hat. Ferner kann der Anwender auch zurücknavigieren, so dass sich die Animation entsprechend umkehrt.
Bei einer weiteren, in den Figuren nicht dargestellten vertikalen Aufteilung des Anzeigebereichs befindet sich beispielsweise im oberen Drittel des Anzeigebereichs (Fensters) das Ergebnis einer (Selektion) in Form einer Liste der Inhalte, im zweiten Drittel des Anzeigebereichs (Fensters) die Verknüpfungen beziehungsweise die Zusammenhänge zu einem ausgewählten Inhalt aus der Liste des ersten Bereiches und im letzten Drittel des Anzeigebereichs (Fensters) eine Vorschau des ausgewählten Inhaltes (Informationen repräsentierenden Datums). Die in dem dritten Bereich des Anzeigebereichs wiedergegebene Vorschau ist mitunter besser lesbar beziehungsweise sehbar, wenn das Größenverhältnis zwischen den ersten beiden Bereichen und dem dritten Bereich variabel einstellbar ist, sogenanntes "Splitplane". Die Steuerung beziehungsweise Navigation ist in diesem Fall vorteilhafterweise auf die beiden ersten Bereiche des Anzeigebereichs beschränkt, während die Vorschau im dritten Bereich an gleicher Stelle einfach wechselt. Die Reihenfolge der Fensterbereiche kann je nach Implementierung variieren.
Vorteilhaft an der graphischen Benutzerschnittstelle des erfindungsgemäßen Datenverarbeitungssystems ist, dass der Anwender auf einen Blick erkennen kann welche Inhalte zusammen gehören und direkt weitersteuern beziehungsweise - navigieren kann, um Inhalte zu suchen oder aus erfassten Zusammenhängen direkt Erkenntnisse abzuleiten. Dabei wird erfindungsgemäß eine endlose Steuerung beziehungsweise Navigation bereitgestellt.
Die in Fig. 18 mit den Bezugszeichen 1 bis 7 gekennzeichneten Felder weisen nachfolgende Funktionalität auf:
1 : Listeneinträge lassen sich per Drag and Drop in die Liste der Verweise ziehen, um eine Verknüpfung herzustellen. Ein Doppelklick öffnet die Detailansicht in einem neuen Fenster;
2: Spaltenüberschriften: Mit einem Mausklick ist ein Sortierkriterium auswählbar;
3: Scrollbalken, um Listen und Detaillisten, die im Fensterbereich nicht vollständig darstellbar sind, komplett ansehen zu können;
4: der Bereich für die Liste lässt sich mit gedrückter Maustaste verschieben und auch ganz "einklappen";
5: Detaillisteneintrag weist Scrollingbalken auf, um Listen und Detaillisten, die im Fensterbereich nicht vollständig darstellbar sind, komplett ansehen zu können; 6: mit Funktionen hinterlegte Spaltenpositionen, beispielsweise führt eine E-Mail- Adresse zu einer Maske zum Schreiben einer E-Mail und
7: Verweise, können einfach gelöscht werden, indem man diese per Maus aus dem Fensterbereich zieht.
Nachfolgend werden exemplarisch im Rahmen der Nutzung des Datenverarbeitungssystems anfallende Prozesse und deren Realisierungen seitens der jeweiligen Benutzeroberfläche beschrieben:
- "Anzeigen einer Liste"
In der Anwendung der Benutzeroberfläche (GUI) wählt der Anwender aus dem Menü beziehungsweise der Navigation zur Anzeige von Inhalten einen Menüpunkt aus, beispielsweise, um alle jüngsten Projekte zu sehen. Die Liste der auszuwählenden Menüpunkte ist ähnlich einer Bookmarkliste eines Browsers. Beim erfindungsgemäßen Datenverarbeitungssystem verweisen die Bookmarks jedoch nicht auf statische Seiten oder Listen, sondern auf dynamische Zusammenhänge. Dementsprechend wird dieser Teil der Navigation von Anwender zu Anwender unterschiedlich aussehen. Vorliegend ist das Datenverarbeitungssystem als JA VA-Client realisiert.
- "Attribute hinzufügen"
Um ein neues Attribut einem Inhaltsobjekt hinzuzufügen, ruft der Anwender den Bearbeitungsmodus eines Inhaltsobjektes aus. Neben den vorhandenen Attributen findet der Benutzer ein freies Feld, in das er ein neues Attribut eintragen kann oder auf eine nebenstehenden Liste auswählen kann. Eine Adresse ist ein Objekt für das der IQser Attribute vorschlägt.
Weil im Java-Client nicht zwischen Bearbeitungs- und Ansichtsmodus unterscheiden, wird vorteilhafterweise vorgeschlagen für diese Variante, bei der Navigation "neu" die Option "Attribut hinzufügen" zu ergänzen. Wird mit externen Datenquellen gearbeitet, werden die zusätzlichen Attribute im IQser gespeichert.
Wählt der Anwender im Menü die Option "Baustein" (oder eine andere Bezeichnung) wird in der Detailansicht ein neuer leerer Baustein gezeigt. Die Bezeichnung ist ebenfalls leer. Vorteilhafterweise gibt es eine zusätzliche Auswahlbox mit den bisher definierten Bausteinen. Vorteilhafterweise überprüft das Datenverarbeitungssystem im Anschluss, ob es diese Bezeichnung für einen Baustein bereits gab und korrigiert gegebenenfalls einen Schreibfehler oder Redundanzen.
Fig. 19 zeigt und beschreibt exemplarisch den Ablauf einer erfindungsgemäßen Kontextsuche im Rahmen einer erfindungsgemäßen Zusammenhangserfassung. Bei einer erfindungsgemäßen Kontextsuche werden vorliegend in einem semantischen Netz nur solche Inhalte durchsucht, die im Zusammenhang eines bestimmten Inhaltes stehen. Damit kann die Suche kontextabhängig erheblich verfeinert werden. Die Kontextsuche wird mit einem Suchstring sowie einer Content-ID an die Datenverarbeitungseinrichtung, vorzugsweise einen Server, übergeben. Wie das Flussdiagramm nach Fig. 19 zeigt, erfolgt zunächst eine Suchanfrage auf der Basis des Suchstrings. Dann werden die Verknüpfungen zu dem Content-Object aufgerufen, in dessen Kontext das Suchergebnis stehen soll. Dann wird diese Liste durchiteriert und überprüft, ob ein Listeneintrag in dem Suchergebnis vorkommt. Wenn ja, wird dieser Listeneintrag in die Ergebnisliste aufgenommen. Erfindungsgemäß erfolgt die Zusammenhangsanfrage dabei vorteilhafterweise als eine Anfrage an eine Suchmaschine. Im Rahmen einer Zusammenhangsanfrage erfolgt also zunächst eine Zusammenhangsanfrage mit der wenigstens einen vorgebbaren Information (Suchstring) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Zusammenhangsanfrage, anschließend erfolgt eine Zusammenhangsanfrage mit dem wenigstens einen Ergebnis der Zusammenhangsanfrage mit dem Suchstring als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Zusammenhangsanfrage mit der Content-ID. Schließlich wird das Ergebnis der Zusammenhangsanfrage mit dem Ergebnis der Zusammenhangsanfrage mit dem Suchstring erfasst und wiedergegeben.
Fig. 20 zeigt ein Ausführungsbeispiel für eine erfindungsgemäße ontologische Zusammenhangserfassung im Rahmen einer erfindungsgemäßen
Zusammenhangserfassung. Implizite Ontotogie bedeutet dabei vorliegend, dass automatisch eine Menge von Aussagen im Sinne einer Subjekt-Prädikat-Objekt- Beziehung (SPO-Beziehung) erzeugt wird, die auch im Semantic Web, insbesondere OWL und RDF eine Rolle spielt. Damit werden natürlichsprachliche Abfragen ermöglicht, die mit Hilfe von AIML aufgelöst werden können.
Schon während des erfindungsgemäßen Analyseprozess wird die SPO-Beziehung festgelegt und abgespeichert. Immer wenn ein Link erzeugt wird, wird die Methode createl_ink(c1 , c2, p, w)
aufgerufen, wobei p das Prädikat repräsentiert, das das Subjekt d mit dem Objekt c2 verbindet. Mit w wird die Gewichtung der Verknüpfung repräsentiert. Bei der Musteranalyse bekommt p die Bezeichnung "alike" (ähnlich). Bei der Syntax-Analyse erhält p die Bezeichnung des Schlüsselattributes, das die Verknüpfung hergestellt hat. Bei manuellen Verknüpfungen kann p frei bestimmt werden.
Es sind bei der Verwaltung der Aussagen (SPO-Beziehungen) zwei vorteilhafte Möglichkeiten gegeben:
• Es gibt mehrere Prädikate (sozusagen Tags) für jede Beziehung. Hier wird bei einem Link, der bereits existiert, überprüft, ob das Prädikat bereits vorhanden ist. Wenn nicht, wird es den existierenden Tag hinzugefügt.
• Es gibt mehrere Beziehungen des selben Paares d und c2 mit jeweils einem Prädikat. Hier wird jeweils überprüft ob es eine Beziehung mit dem neuen Tag bereits gibt. Wenn nicht, wird eine neue Beziehung angelegt, die mit dem aktuellen Tag geschrieben wird.
Die erste Variante sorgt bei der Anzeige der Verknüpfungen vorteilhafterweise für mehr Übersichtlichkeit.
Damit sind beispielsweise folgende Abfragen erfindungsgemäß möglich:
• Wer ist Autor eines Dokumentes, dass sich mit dem Thema "Umweltschutz" beschäftigt?
• Wer ist Freund von Max Mustermann (falls dieser Tag gesetzt wurde).
• Wer ist Projektleiter in einem Projekt über Solarzellen?
• Welches Zubehör gibt es für das Gerät XY?
In der Umsetzung dieser Abfragen werden vorteilhafterweise Kombinationen aus Filter- und/oder Verknüpfungsabfragen eingesetzt. Besonders vorteilhaft in die erfindungsgemäß vorgesehene und eingerichtete Möglichkeit, bei jeder Verknüpfung einsehen zu können, wie diese Verknüpfung zustande gekommen ist. Das wird zum Beispiel mit einer Spalte in einer Ergebnistabelle angezeigt.
Das Flussdiagramm in Fig. 20 zeigt, wie die Zusammenhangsanfrage "Wer ist Autor von Dokumenten, die sich mit Umweltschutz beschäftigen?" erfindungsgemäß ontologisch umgesetzt wird.
Eine ähnliche Zusammenhangsanfrage könnte lauten: „Wer war oder ist Mitarbeiter in einem Projekt über Solarzellen?" Die Frage lässt sich auf zwei Variablen reduzieren:
• Tag für den Zusammenhang
• Filter für die Suchanfrage
Damit ist eine neue Methode bereitgestellt, die komplexe Anfragen ermöglicht.
Eine weitere vorteilhafte Anwendung einer ontologischen Zusammenhangsanfrage ist in einem erfindungsgemäßen Verfahren für eine automatische thematische Zuordnung von Texten gegeben.
Unternehmen verfügen oft über eine Vielzahl von Texten. Es ist für den Zugriff und die Verarbeitung von Information hilfreich, wenn Texte automatisch einem Sachgebiet zugeordnet werden bzw. einem Sachgebiet die entsprechenden Quellen. Für Zusammenhangsanfragen gemäß der vorliegenden Erfindung sind folgende Möglichkeiten gegeben:
1. Über ein Plugin wird eine Datenbank mit Sachgebieten angebunden. Für jedes Sachgebiet kann ein Experte die Morpheme und Wörter zusammenstellen, die charakteristisch für das Sachgebiet sind. Die automatischen Analysen der erfindungsgemäßen Lösung übernehmen im Rahmen von Zusammenhangsanfragen die Aufgabe der Zuordnung von Texten aber auch die Beziehung von Sachgebieten, die sich ergänzen oder einschließen. Im Ergebnis kann der Anwender über Sachgebiete navigieren und entsprechende Quellen finden. 2. Das Unternehmen stellt eine Textsammlung zur Verfügung, die mit einem speziellen Werkzeug auf charakteristische Wörter und Morpheme untersucht wird. Dafür wird aus den Texten eine Wortliste generiert, wobei jedem Wort die statistische Häufigkeit zugeordnet wird. Diese Wortliste wird durch eine Liste von Artikeln und Basisverben (Stoppwörter) gefiltert und in eine Absteigende Reihenfolge nach Worthäufigkeit gebracht. Die 32 häufigsten Wörter werden für die Beschreibung des Sachgebietes verwendet.
3. In Anlehnung an die Musteranalyse von Volltexten können in der in Ziffer 2. beschriebenen Wortliste die 32 am wenigsten vorkommenden Wörter genommen werden. Dadurch wird eine unscharfe Abgrenzung von Stoppwörtern verhindert bzw. eingespart.
4. In einem Analyseprozess wird ein Text in eine Wortliste überführt. Jedes Wort wird im Anschluss mit der Datenbank des Projektes Deutscher Wortschatz (http://www.wortschatz.uni-leipzig.de) abgeglichen aus dem das Sachgebiet ermittelt wird. So entsteht aus der erfindungsgemäßen Wortliste eine Liste von Sachgebieten. Diese Liste wiederum wird zusammengefasst, indem jedes Sachgebiet nur einmal mit der zugeordneten Häufigkeit vorkommt. Anschließend wird die Liste absteigend sortiert. Die drei am häufigsten auftauchenden Sachgebiete werden als Tag dem Inhalt (Content-Object) zugeordnet.
δ. Eine besonders bevorzugte und präzises Methode der Erfindung ist mit einer Differenzanalyse gegeben. Dabei werden vorteilhafterweise zwei Textsammlungen verglichen. Vorzugsweise eine Textsammlung mit allgemeinen Themen, zum Beispiel die Basis des Projektes Deutscher Wortschatz, und eine Textsammlung mit Texten aus einem bestimmten Fachgebiet. Aus beiden Textsammlungen wird eine Wortliste, vorzugsweise ohne Dubletten, generiert. Die Worte werden dabei in absteigender Reihenfolge ihrer Häufigkeit gemeinsam mit diesem Wert sortiert. Im zweiten Schritt wird für jedes Wort der beiden Wortlisten die relative Häufigkeit berechnet aus dem Quotienten der absoluten Häufigkeit und der Gesamtzahl der Wortformen der jeweiligen Liste. Im dritten Schritt werden die beiden Wortlisten verglichen. Für die Wortliste aus dem Textkorpus der Fachtexte wird für jedes Wort ein Quotient aus der relativen Häufigkeit der selben Liste mit der relativen Häufigkeit aus der anderen Liste gebildet. Anschließend wird die so ergänzte Wortliste nach diesem Wert sortiert. Vorliegend werden die 32 häufigsten Wörter als beschreibend für ein Fachgebiet ausgewählt. Diese 32 Wörter können zur Beschreibung eines Sachgebietes im Rahmen einer erfindungsgemäßen Lösung (IQser) genutzt werden, um Texte mit Hilfe der Musteranalyse automatisch zuzuordnen.
Die in den Figuren der Zeichnung dargestellten und in Zusammenhang mit der Beschreibung erläuterten Ausführungsbeispiele der Erfindung dienen lediglich der Erläuterung der Erfindung und sind für diese nicht beschränkend.

Claims

Ansprüche:
1. Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes erfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes erzeugt wird, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) nur solche Informationen repräsentierenden Daten für die Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt werden, die wenigstens einen Zusammenhang zu wenigstens einer vorgebbaren Information aufweisen.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Zusammenhangsanfrage als eine Anfrage an eine Suchmaschine erfolgt.
3. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, dass die vorgebbare Information zusammen mit einem erfassten Zusammenhang als eine Information repräsentierendes Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt wird.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zunächst eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt, anschließend eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt und schließlich das wenigstens eine Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfasst und wiedergegeben wird.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die vorgebbare Information eine von einem Anwender und/oder einer Anwendung wählbare Abfolge von Buchstaben und Sonderzeichen ist (Suchstring).
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zwischen den wenigstens eine Information repräsentierenden Daten einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) automatisch eine Aussagenmenge im Sinne von Subjekt-Prädikat-Objekt-Beziehungen erzeugt wird, so dass natürlichsprachliche Anfragen nach einem Zusammenhang (Zusammenhangsanfragen) erfolgen können.
7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Wörter in der Liste (Wortliste) von in dem Volltext enthaltenen Wörtern nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortiert werden und die sortierten Wörter unter Berücksichtigung der Häufigkeit ihres Vorhandenseins in dem Volltext als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.
9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass eine vorgebbare Anzahl der nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortierten Wörter in einer Liste (sortierte Wortliste) erfasst werden und die Wörter der Liste (sortierte Wortliste) als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.
10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Liste (sortierte Wortliste) die Wörter mit der geringsten Häufigkeit ihres Vorhandenseins in dem Volltext enthält.
11. Verfahren nach Anspruch 9 oder Anspruch 10, dadurch gekennzeichnet, dass die Wörter nach der Häufigkeit ihres Vorhandenseins in dem Volltext aufsteigend sortiert werden.
12. Verfahren nach einem der Ansprüche 1 bis 11 , dadurch gekennzeichnet, dass die Wörter der Liste zumindest teilweise parallel als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.
13. Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, die Verknüpfung durch manuelle Eingabe erzeugt wird, vorzugsweise durch eine Auswahleingabe.
14. Verfahren nach einem der Ansprüche 1 bis 13, gekennzeichnet durch wenigstens eine elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage).
15. Verfahren nach einem der Ansprüche 1 bis 14, gekennzeichnet durch eine Erfassung von elektronischen Nutzungen von wenigstens eine Information repräsentierenden Daten wenigstens eines Datenbestandes nach Zeit und/oder Häufigkeit und Nutzung dieser Erfassung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage).
16. Verfahren nach einem der Ansprüche 1 bis 15, gekennzeichnet durch wenigstens eine Erfassung eines Zusammenhangs als elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums eines Datenbestandes.
17. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, dass die Zusammenhangserfassung gewichtet erfolgt.
18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Zusammenhangsgewichtung wenigstens eines bereits als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand erfassten Zusammenhangs in Abhängigkeit der Zusammenhangsgewichtung eines nachfolgend erfassten Zusammenhangs verändert wird, vorzugsweise die Zusammenhangsgewichtung erhöht (inkrementiert) oder erniedrigt (dekrementiert) wird.
19. Verfahren nach einem der Ansprüche 1 bis 18, dadurch gekennzeichnet, dass wenigstens ein erfasster Zusammenhang mit dessen Gewichtung wiedergegeben wird.
20. Verfahren nach einem der Ansprüche 1 bis 19, gekennzeichnet durch Nutzung wenigstens eines Verweises auf wenigstens einen Informationen repräsentierende Daten umfassenden Datenbestand.
21. Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, dadurch gekennzeichnet, dass dieses ausgebildet und/oder eingerichtet ist ein Verfahren nach einem der Ansprüche 1 bis 20 zumindest teilweise auszuführen.
22. Datenverarbeitungssystem nach Anspruch 21 , gekennzeichnet durch eine graphische Benutzerschnittstelle zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen.
23. Datenverarbeitungssystem nach Anspruch 22, dadurch gekennzeichnet, dass die graphische Benutzerschnittstelle weiter zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet und/oder eingerichtet ist.
24. Datenverarbeitungssystem nach Anspruch 22 oder Anspruch 23, dadurch gekennzeichnet, dass die graphische Benutzerschnittstelle den zur Wiedergabe seitens einer optischen Anzeigeeinrichtung zur Verfügung stehenden Anzeigebereich in drei Bereiche aufteilt, wobei in einem ersten Bereich das Ergebnis einer Selektion von Informationen repräsentierenden Daten, in einem zweiten Bereich mit einer Anzeige eine aus der Selektion im ersten Bereich ausgewählte Information und in einem dritten Bereich, der wenigstens eine Zusammenhang wiedergegeben wird.
25. Datenverarbeitungssystem nach Anspruch 24, gekennzeichnet durch eine horizontale oder vertikale Aufteilung.
26. Datenverarbeitungssystem nach Anspruch 24 oder Anspruch 25, dadurch gekennzeichnet, dass die Größe der Bereiche ein- und/oder verstellbar ist.
27. Datenverarbeitungssystem nach einem der Ansprüche 21 bis 26, dadurch gekennzeichnet, dass die Wiedergabe zumindest teilweise in auswählbarer Form erfolgt.
28. Datenverarbeitungssystem nach einem der Ansprüche 21 bis 27, dadurch gekennzeichnet, dass dieses Bestandteil einer Datenbankanwendung ist oder zumindest zusammen mit einer Datenbankanwendung nutzbar ist.
29. Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, dadurch gekennzeichnet, dass diese ausgebildet und/oder eingerichtet ist ein Verfahren nach einem der Ansprüche 1 bis 20 zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines Datenverarbeitungssystems nach einem der Ansprüche 21 bis 28.
30. Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, gekennzeichnet durch eine zumindest teilweise gegebene Nutzung eines Datenverarbeitungssystems nach einem der Ansprüche 21 bis 29.
31. Datenverarbeitungsvorrichtung nach Anspruch 29 oder Anspruch 30, dadurch gekennzeichnet, dass diese als mobiles Endgerät ausgebildet ist, vorzugsweise als ein in Mobilfunknetzen nutzbares beziehungsweise betreibbares mobiles Endgerät, besonders bevorzugt als ein Mobilfunktelefon.
EP07802081A 2007-09-03 2007-09-03 Erfassung von zusammenhängen zwischen informationen repräsentierenden daten Withdrawn EP2188742A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2007/007664 WO2009030246A1 (de) 2007-09-03 2007-09-03 Erfassung von zusammenhängen zwischen informationen repräsentierenden daten

Publications (1)

Publication Number Publication Date
EP2188742A1 true EP2188742A1 (de) 2010-05-26

Family

ID=38984421

Family Applications (1)

Application Number Title Priority Date Filing Date
EP07802081A Withdrawn EP2188742A1 (de) 2007-09-03 2007-09-03 Erfassung von zusammenhängen zwischen informationen repräsentierenden daten

Country Status (3)

Country Link
US (2) US9336309B2 (de)
EP (1) EP2188742A1 (de)
WO (2) WO2009030246A1 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2277116A1 (de) * 2008-05-08 2011-01-26 IQser IP AG Erstellung eines kategorienbaums über den inhalt eines datenbestandes
EP2386089A4 (de) * 2009-01-12 2013-01-16 Namesforlife Llc Systeme und verfahren zur automatischen identifizierung und verbindung von namen in digitalen ressourcen
US9494931B2 (en) * 2009-09-23 2016-11-15 Fisher-Rosemount Systems, Inc. Dynamic hyperlinks for process control systems
US20110219030A1 (en) * 2010-03-03 2011-09-08 Daniel-Alexander Billsus Document presentation using retrieval path data
US20110219029A1 (en) * 2010-03-03 2011-09-08 Daniel-Alexander Billsus Document processing using retrieval path data
US20110218883A1 (en) * 2010-03-03 2011-09-08 Daniel-Alexander Billsus Document processing using retrieval path data
NZ589787A (en) * 2010-12-08 2012-03-30 S L I Systems Inc A method for determining relevant search results
US8380750B2 (en) 2011-02-17 2013-02-19 International Business Machines Corporation Searching and displaying data objects residing in data management systems
EP2856344A1 (de) 2012-05-24 2015-04-08 IQser IP AG Erzeugung von anfragen an ein datenverarbeitendes system
DE102012109096A1 (de) 2012-09-26 2014-03-27 Iqser Ip Ag Verfahren zur sequenziellen Bereitstellung von personalisierte Informationen repräsentierenden Daten, insbesondere in Form von Videos und dergleichen, insbesondere für ein personalisiertes Fernsehprogramm
WO2014105867A2 (en) * 2012-12-28 2014-07-03 Xsb, Inc. Systems and methods for creating, editing, storing and retrieving knowledge contained in specification documents
US10229371B2 (en) * 2013-03-04 2019-03-12 Avaya Inc. Systems and methods for indexing and searching administrative data
US9495457B2 (en) * 2013-12-26 2016-11-15 Iac Search & Media, Inc. Batch crawl and fast crawl clusters for question and answer search engine
WO2016169016A1 (en) 2015-04-23 2016-10-27 Yahoo! Inc. Method and system for presenting search result in search result card
IN2015CH03914A (de) * 2015-07-30 2015-08-14 Wipro Ltd
DE102015216722A1 (de) * 2015-09-01 2017-03-02 upday GmbH & Co. KG Datenverarbeitungssystem
DE102016208118A1 (de) * 2016-05-11 2017-11-16 Lenze Automation Gmbh Verfahren zum Konfigurieren eines elektrischen Antriebssystems und Maschine

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748377B1 (en) * 2000-10-18 2004-06-08 International Business Machines Corporation Facilitating query pushdown in a multi-tiered database environment
WO2003073374A2 (en) * 2002-02-27 2003-09-04 Brands Michael Rik Frans A data integration and knowledge management solution
WO2005050471A2 (de) * 2003-11-22 2005-06-02 Wurzer Joerg Datenverarbeitungssystem und -vorrichtung
JP2005165958A (ja) * 2003-12-05 2005-06-23 Ibm Japan Ltd 情報検索システム、情報検索支援システム及びその方法並びにプログラム
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
US7519595B2 (en) * 2004-07-14 2009-04-14 Microsoft Corporation Method and system for adaptive categorial presentation of search results
JP2006099388A (ja) * 2004-09-29 2006-04-13 Hitachi Software Eng Co Ltd テキストマイニングサーバ及びテキストマイニングシステム
WO2007095997A1 (de) * 2006-02-23 2007-08-30 Netbreeze Gmbh System und verfahren zur benutzergesteuerten multidimensionalen navigation und/oder themenbasierten aggregation und/oder überwachung von multimediadaten
US8244730B2 (en) * 2006-05-30 2012-08-14 Honda Motor Co., Ltd. Learning syntactic patterns for automatic discovery of causal relations from text

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
None *
See also references of WO2009030246A1 *

Also Published As

Publication number Publication date
US20100223248A1 (en) 2010-09-02
US9336309B2 (en) 2016-05-10
WO2009030246A1 (de) 2009-03-12
WO2009030288A1 (de) 2009-03-12
US9323842B2 (en) 2016-04-26
US20100223247A1 (en) 2010-09-02

Similar Documents

Publication Publication Date Title
WO2009030246A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP2193456A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
DE60120822T2 (de) Meta-Dokument und Verfahren zum Verwalten von Meta-Dokumenten
Johnson et al. Web content mining techniques: a survey
EP1311989B1 (de) Verfahren zur automatischen recherche
EP1877932B1 (de) System und verfahren zur aggregation und überwachung von dezentralisiert gespeicherten multimediadaten
DE102005040096A1 (de) Umfassendes Abfrageverarbeitungs- und Datenzugriffssystem, und eine Benutzerschnittstelle
DE60101668T2 (de) Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument
EP2193455A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP1685505B1 (de) Datenverarbeitungssystem
EP2193457A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
EP1754171A1 (de) Verfahren und system zur automatisierten erzeugung von computergestützten steuerungs- und analysevorrichtungen
WO2013174407A1 (de) Erzeugung von anfragen an ein datenverarbeitendes system
EP2198378A1 (de) Erfassung von zusammenhängen zwischen informationen repräsentierenden daten
Wiesman et al. Information retrieval by metabrowsing
Crowder et al. Navigation over a large ontology for industrial web applications
EP1280071B1 (de) Verfahren zur Erzeugung eines tabellengesteuerten Dialoges mit Mehrfach-Navigation für relational-multimediale Informationssysteme
DE19842320A1 (de) Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten
EP3531300A1 (de) Computerimplementiertes verfahren zum beschaffen von informationen
WO2010043212A2 (de) Datenorganisations- und auswertungsverfahren
DE102012013578A1 (de) Modul mit einer interaktiven Darstellung einer Suchanfrage für einen Computer auf einem Display für einen Bediener
EP1977349A2 (de) Verfahren zum computergestützten bearbeiten von quelldatenelementen, system und computerprogrammprodukt
EP2287751A1 (de) Recherchensystem und Verfahren zur Informationssuche
DE10053802A1 (de) Suchmaschine sowie Computersystem und computerbasiertes Verfahren zur Darstellung der von einer Suchmaschine in einem Datenbestand gefundenen Treffer und zur Navigation in diesen Treffern

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20100401

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC MT NL PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA HR MK RS

DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20160608

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

APBK Appeal reference recorded

Free format text: ORIGINAL CODE: EPIDOSNREFNE

APBN Date of receipt of notice of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA2E

APBR Date of receipt of statement of grounds of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA3E

APAF Appeal reference modified

Free format text: ORIGINAL CODE: EPIDOSCREFNE

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: IQSER IP GMBH

APBT Appeal procedure closed

Free format text: ORIGINAL CODE: EPIDOSNNOA9E

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN WITHDRAWN

18W Application withdrawn

Effective date: 20210325