WO2010068068A2 - 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 - Google Patents

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 Download PDF

Info

Publication number
WO2010068068A2
WO2010068068A2 PCT/KR2009/007443 KR2009007443W WO2010068068A2 WO 2010068068 A2 WO2010068068 A2 WO 2010068068A2 KR 2009007443 W KR2009007443 W KR 2009007443W WO 2010068068 A2 WO2010068068 A2 WO 2010068068A2
Authority
WO
WIPO (PCT)
Prior art keywords
information
search
intention
metadata
editor
Prior art date
Application number
PCT/KR2009/007443
Other languages
English (en)
French (fr)
Other versions
WO2010068068A3 (ko
Inventor
정희성
Original Assignee
주식회사 네오패드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 네오패드 filed Critical 주식회사 네오패드
Priority to CN200980150114.1A priority Critical patent/CN102246164B/zh
Priority to JP2011540611A priority patent/JP5481615B2/ja
Priority to US13/139,118 priority patent/US9256679B2/en
Publication of WO2010068068A2 publication Critical patent/WO2010068068A2/ko
Publication of WO2010068068A3 publication Critical patent/WO2010068068A3/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Definitions

  • the present invention relates to a multifunctional information retrieval method and system for providing and searching information using words, phrases and sentences of a natural language as a search word, and providing more accurate information and searching based on a user's intention.
  • convergence technology of wired / wireless broadcasting communication technology, integrated information web service technology, and development of user interface technology convenient for various user layers are representative ones.
  • the specific contents of these technologies are to automatically interpret the provided or provided contents, the quality and meaning of the information with a computer, so that the information contents are presented and provided in a convenient and various manner according to the taste and intention of the information contents user.
  • Market technology is expected.
  • Korean Patent Publication No. 10-2006-0043333 (system and method for determining the intent of data and responding to data based on the intent) is a system for facilitating data handling, comprising: a component for receiving data;
  • a component for receiving data For purposes of a system comprising a data manager for determining an intent of the data, reorganizing at least a subset of the data based on the intent, and automatically presenting the reorganized data to a user,
  • a system for analyzing the data classifying the data into one or more sets having related features, and extracting features from at least one set of the data sets to form a subset of the data;
  • the metadata of the data Uses at least one of data, attributes, content, context, keywords, history, heuristics, reasoning, rules, demarcation, time of day, day of the week, associated handling costs, associated handling gains, and sources.
  • a system that is extracted based at least in part on one of syntactic, syntactic, linguistic, and linguistic properties, wherein the linguistic features include words that occur in sentences, double-word words that occur in sentences, and An object is to include at least one of the word trigrams generated in a sentence.
  • Korean Patent Publication No. 2002-0028593 is a step in which a computer user enters member information and accesses a management server, and the computer user registers / transmits the information input screen displayed by the management server.
  • the harmful word blocking module of the management server determining whether the harmful word is included in the information input by the computer user
  • the management server is configured to determine whether the harmful word blocking module Characterized by the harmful word blocking method characterized in that the connection to the user, or the step of registering / transmitting the information, characterized in that the definition of the harmful word refers to slang, profanity, sexual insults or personal insults. If the message you send does not contain harmful words, please It consists of a processing module in progress.
  • the patent is based on the presence of harmful words in the message on the chat.
  • Korean Patent Publication No. 10-2006-0062300 (a multi-step text filtering method for blocking harmful sites) divides the text to be used as a material for blocking pornographic sites into at least one set by dividing it into at least one set and then database And collecting text from a web site being accessed and comparing the text with text in the set to perform at least one multi-step filtering to determine whether to block the web site being accessed.
  • Multi-level text filtering method for blocking harmful sites is to block harmful sites according to the degree of lewdness in the text.
  • Korean Patent Laid-Open Publication No. 10-2006-0087735 (system and method for providing improved spam message filtering) is a system for providing spam message filtering, wherein the wireless network receives a message for transmission from a sender terminal to a user terminal.
  • the server, the use cases of the natural language sentences, and accessory information on these use cases are stored, and a large-scale language database (Corpus DB) which can be classified into categories according to each use purpose, and the corpus DB in the wireless network server.
  • a lexical analyzer detecting a reception and extracting at least one noun type keyword from a sentence included in the received message, and selecting one of the extracted noun type keywords and setting the user to a spam message In sentences contained in each of the user categories in the Corpus DB.
  • a corpus search unit for searching spam frequencies used and a general frequency used in sentences included in a category other than the user category, and when the at least one spam frequency and the general frequency are input, the selected noun-type keyword is entered.
  • Probability calculation unit for calculating the probability that the included sentence is included in the user category, and control the lexical analysis unit and the corpus search unit to calculate the spam message inclusion probability for each noun type keyword from the probability calculation unit, and calculate And a filtering control unit for calculating whether or not the received message is a spam message by calculating statistical values of the probabilities, and transmitting the determination result to the wireless network server.
  • Evaluate, analyze, and analyze messages for spam Ryu is a methodology.
  • Korean Patent Publication No. 10-2008-0000416 (harmful message filtration system and filtering method thereof and a recording medium recording the same) has a database storing messages received from clients connected through a network, and a system for filtering harmful messages.
  • the method may include: a message receiving means for receiving the message, a word extracting means for extracting a plurality of words from the received message, and determining whether the message is harmful by using the extracted plurality of words, and storing the message in the database; Means, wherein the evaluating means determines whether the message is harmful using the word evaluation value stored in the database, and classifies the message into a plurality of harmful message classifications.
  • Korean Patent Registration No. 10-0484944 (morphological semantic automatic tagging device based on local syntactic relation and semantic air dictionary) is a basic syntax structure generation rule, dependency syntax rule, stemming semantic electronic dictionary, semantic framework and Short phrase recognition means for recognizing short sentences by means of lexical phrases, semantic frame and lexical phrases Means of restoring the auxiliary fire using auxiliary air dictionaries, lexical argument using lexical phrase air dictionaries Determining the meaning of nouns in noun phrases and compound nouns in a noun phrase using a noun phrase meaning determination means, and a noun phrase that consists of nouns / investigations / nouns and noun / noun air information Means for determining the meaning of a noun phrase, comprising a morpheme based on local syntax and meaning
  • the correct syntax air information context information it means that devices using the syntax structure information from the linguistic point of view on auto-tagging devices presents a way to resolve the ambiguity meaning of the noun
  • Korean Patent Registration No. 10-0757951 (a search method through stemming analysis of a web page) is a client of a computer, a notebook, a mobile phone, a PDA, and the like, and an analysis server for providing information to the client, wherein the client user taps
  • the analysis server analyzes the context of the content displayed in the tab browser of the client through context morpheme analysis. Identifying a frequency, a sentence having a frequency above a reference value among the identified words, selecting a word as a keyword as an important word, outputting the selected important word as a title of each tab browser, and displaying each of the tab browsers.
  • the present invention relates to a search method through morphological analysis of a web page comprising the step of outputting the contents of a web page.
  • the patent is a methodology of a search system that calculates the number of sentences and words appearing in text by morphological processing. How to output it as a tab web browser title as a keyword.
  • Korean Patent Registration No. 10-0691400 (a method for analyzing a morpheme using additional information and a morpheme analyzer for performing the method), in a morpheme analysis method, includes a morphological analysis target and a morphological analysis target from a search index data. Obtaining an associated additional information, generating a key based on the additional information, and performing a morphological analysis on the morphological analysis object using the key. Way.
  • Korean Patent Publication No. 10-2007-0029389 (a method for providing an advertisement service using a core keyword, a system and a recording medium on which a program for implementing the same) is recorded is provided to a digital processing apparatus to provide a keyword advertisement service using a core keyword.
  • a program of instructions that can be executed by a program is tangibly embodied and can be read by a digital processing device.
  • the method includes extracting keywords by analyzing the morphemes of content texts, and key keywords through interfacing with an advertisement keyword DB server. Determining an advertisement, receiving an advertisement list matching the core keyword through interfacing with an advertisement DB server, and inserting at least one of advertisements included in the advertisement list into the content text. Recording media.
  • Korean Patent Publication No. 10-2006-0011333 (Regional Information Providing System and Method through Message Analysis) is a database for storing advertisement information for each region and industry, message recognition means for analyzing stored short messages or text messages. Requesting the message recognition means and the voice recognition means to store the voice recognition means for analyzing the stored voice message, the location information collecting means for confirming the current location of the subscriber station, and the message related to the service subscriber.
  • Confirming the message analysis result transmitted from the recognition means and the voice recognition means optionally request the current location information of the subscriber station to the location information collecting means, and desired according to the message analysis result to deliver the desired information to the subscriber terminal Services that provide industry and local information
  • Message generation means for retrieving information from the database using the business type and area information transmitted from the service control means and the service control means, and including the search result in a short message and transmitting the result to the subscriber station. Local information provision system through.
  • Korean Patent Publication No. 10-2007-0015752 (Advertising-induced messaging service system and method thereof) is an advertisement-induced messaging service system that detects an advertisement-inducing identifier by analyzing a message transmitted from a calling terminal, and then designates a predetermined advertisement message. After transmitting to the calling terminal, and the message server for transmitting the contents of the message to the receiving terminal.
  • Korean Patent Registration No. 10-0775680 (Method and system for providing advertisement contents using a chat of a mobile communication terminal) is a method of exchanging messages with each other through a messenger between a mobile communication terminal and a server connected through a wireless communication network. Determining whether the mobile communication terminal connected to the server selects a virtual chat partner to be chatted with, and the server extracts a chat scenario of an advertisement content product according to user preference information of the mobile communication terminal. Transmitting a message according to a scenario rule to the mobile communication terminal, transmitting a response message to the message of the server in the mobile communication terminal, and analyzing the message of the mobile communication terminal received from the server.
  • Advertising content information according to the intention and the above scenario rule Transmitting a message requesting the cloth permission to the mobile communication terminal; and transmitting the advertisement content information to the mobile communication terminal when the server transmits a message for recommending the advertisement content information from the mobile communication terminal.
  • the transmitting of the message to the mobile terminal by the server may include: previously, analyzing the message of the mobile terminal by the server and adjusting a character state of the messenger according to the intention of the user. Advertising content providing method using a chat of the mobile communication terminal further comprising.
  • Korean Patent Registration No. 10-0597435 (Hybrid-based Question Classification System and Method in Information Retrieval and Question Answer System) is a question title processing unit that recognizes the name of the work included in the input question, a morphological analysis of the question, and an individual name.
  • Question language analysis unit that converts individual vocabularies into meaningful codes through recognition and lexical semantic tagging process, and rules that classify the correct type of answers required by the question using meaningful LSP form codes of the questions and predefined question classification rules.
  • Korean Patent Registration No. 10-0361166 (Information Retrieval System and Method) includes a plurality of information classified by a field, a code is assigned to each classified field, and a plurality of information included in the corresponding field in association with a code of each field. If a user who wants to search the data is coded with a database representing words of information and a user who wants to search the data is connected through a network using a communication device, and inputs a word indicating the information to be searched or indicates a field to which the information belongs, A processing device for encoding the coded words and searching the database based on the coded words to find information corresponding to the coded words, wherein the information stored in the database is classified into a plurality of information areas and the information area.
  • Each is assigned an information classification code and contains one or more details.
  • the detailed information areas are coded in association with an information classification code of the corresponding information area, and words having the same or similar meanings among the words representing the information are stored with the same code.
  • Information retrieval system method arranged in set order.
  • Korean Patent Publication No. 10-2005-0092955 (Online Advertising System and Advertising Method) includes a first storage device for storing information to be advertised, a second storage device for storing original content, and original content from a second storage device. At least one server to take a and analyze the natural language processing technique, the information to be advertised corresponding to the analysis result from the first storage device and insert some of the advertisement information into the original content and by the at least one server And a third storage device storing the content in which the advertisement information is inserted.
  • Korean Patent Registration No. 10-0669534 (document summary method and system using sentence abstraction and probability rule and sentence meaning analysis and expression method) includes a sentence input step of inputting and storing document contents to be summarized; A parsing step for parsing and storing the data stored in the step; A sentence main component extraction step of sequentially reading the syntax data in the step, extracting main components from each sentence, and storing the ontology data; The ontology data value in the step is compared with the cognitive upper category information, which is a predetermined classification criterion for the meaning of each of the selected main elements, and the data value identified as the abstract meaning for each of the selected main elements.
  • Sentence abstracting step of storing A topic selection step of reading a stored value in the step and inputting it into a probability rule program operating unit to select a plurality of topics having probability between phrases, and storing identification values for the selected plurality of topics respectively;
  • a summary sentence output step of judging whether there is an output control signal and, if so, outputting and displaying the data value stored in the step through the operation of the output means.
  • Korean Patent Registration No. 10-0836878 (a subject or field allocating apparatus and method thereof in an information retrieval system) is connected to a user terminal, a web portal site, or a web site through the Internet to search for information and provide searched information.
  • a subject or field assignment apparatus in a search system the information search server comprising: a search engine for performing an information search on a document based on a query word or an index word corresponding to a document; A database for storing and managing information retrieved from the search engine; A thesaurus matching unit for extracting an index word from the original text stored in the database and performing a thesaurus matching by the index word to assign a subject or a field to the original text;
  • a subject in an information retrieval system comprising a; taxonomy processing unit for extracting a term from a definition sentence stored in the database and assigning a subject using the extracted term and assigning a subject using a taxonomy A field allocation device.
  • the information retrieval system used by large information search portals such as Google and Yahoo is mainly based on the search key method of "word" unit, even though the "old" unit input is possible, Rather than the linguistic processing method, Ngram-based index keys are linked to logical operators (AND, OR, NOT) to present search results. Therefore, current technology has a limitation in improving reproducibility and accuracy of information retrieval. In particular, 'mobile information retrieval' technology is attracting attention as the next generation information retrieval field, and the new web retrieval technology is being proposed and discussed.
  • the present invention has been made to solve the above problems, and an object of the present invention is to expand the search key by phrase unit and sentence unit in an information retrieval system using a word unit as a search word to view a user interface of the information retrieval system. Not only is it convenient, but also it is to provide a multifunctional integrated information retrieval method and system capable of integrated processing such as providing, searching, classifying, evaluating and monitoring information.
  • the present invention is to provide a multifunctional integrated information retrieval method and system that grasps the intention of the information searcher or the information provider and provides an information result based on the identified intention.
  • an information retrieval method using an analysis result for the search word, to determine the intention of the searcher; Providing the searcher with an editor suitable for the searcher's intention; And searching for content having metadata associated with metadata input through the input items of the editor.
  • the information retrieval method may further include: separating the input search word into meaningful words; And parsing the separated search terms, wherein the searching of the searcher's intention is preferably to grasp the searcher's intention using the syntax analysis result in the parsing process.
  • the syntactic analysis step it is preferable to output a syntax expression obtained by analyzing what grammatical and semantic relations the separated words have in the sentence as the syntax analysis result.
  • syntax expression is preferably at least one of a logical expression, a formula-defense expression, and a syntax list item.
  • the syntax parsing step in order to interpret what grammatical and semantic relations the separated words have in a sentence, refer to a syntax grammar rule dictionary, and the syntax syntax rule dictionary is a phrase structure grammar, case. It is preferable that at least one of grammar, dependency syntax, and lexical syntax be included.
  • the separating step it is preferable to separate the search word by parts of speech.
  • the separating step it is preferable to divide the search word by parts of speech by referring to the information on the parts of speech of each word in the morpheme dictionary.
  • the method may further include extracting metadata about content suitable for the searcher's intention, and the providing of the editor may include: an editor in which the extracted metadata are input items; It is desirable to provide.
  • the information retrieval method may further include determining a directory in which a search is to be performed by referring to the intention of the information provider, wherein the retrieving step includes searching the content in a directory identical or similar to the determined directory. desirable.
  • the search word may be any one of a word unit, a phrase unit, and a sentence unit.
  • the searching may include content having metadata identical to at least one of metadata input through the input items of the editor or at least one of metadata input through the input items of the editor. It is desirable to search for.
  • the information retrieval method may further include adding an additional service to the search result in the search step.
  • the additional service may be a content context awareness service, and the content context perception may include at least one of a guide service, a trading service, an advertisement service, an education service, a counseling service, a recommendation service, an auction service, and an administrative service. It is preferable to include one.
  • At least one of the input items of the editor may be automatically input into real data generated using the search word.
  • the information retrieval method may further include selecting and outputting highly matched contents by comparing the input metadata with metadata constituting the searched content.
  • the search information providing method using the analysis result of the text included in the information, grasping the intention of the information provider providing the information; Providing a user with an editor suitable for the intention of the information provider; And storing content integrating metadata input through the input items of the editor.
  • the search information providing method may further include: separating the text included in the input information into meaningful words; And parsing the separated words; wherein the determining of the intention of the information provider comprises using the result of parsing in the syntax parsing step, to grasp the intention of the information provider providing the information. desirable.
  • the syntactic analysis step it is preferable to output a syntax expression obtained by analyzing what grammatical and semantic relations the separated words have in the sentence as the syntax analysis result.
  • syntax expression is preferably at least one of a logical expression, a formula-defense expression, and a syntax list item.
  • the syntax parsing step in order to interpret what grammatical and semantic relations the separated words have in a sentence, refer to a syntax grammar rule dictionary, and the syntax syntax rule dictionary is a phrase structure grammar, case. It is preferable that at least one of grammar, dependency syntax, and lexical syntax be included.
  • the separating step it is preferable to separate the text by parts of speech.
  • the separating step it is preferable to divide the text by parts of speech by referring to the information on the parts of speech of each word that is databased in the morpheme dictionary.
  • the search information providing method may further include extracting metadata about content corresponding to the intention of the information provider, and the providing of the editor may include an editor in which the extracted metadata are input items. It is desirable to provide an editor suitable for the intention of the information provider.
  • the method for providing information for searching further includes determining a directory in which the information is to be stored with reference to the intention of the information provider, wherein the content storing step preferably stores the content in the determined directory. Do.
  • the search information providing method may further include collecting text included in contents classified for each directory, wherein the grasping step may use an analysis result of the collected text.
  • a method for providing information for search includes: collecting text included in contents classified for each directory; Identifying the intention of the information provider who provided the information by using the analysis result of the collected text; Providing a user with an editor suitable for the intention of the information provider; And storing content integrating metadata input through the input items of the editor.
  • the information retrieval method the step of receiving a search word; Receiving an intention of a searcher who inputs the search word; Providing the searcher with an editor suitable for the ultimate intention that integrates the search result of the search term and the searcher's intention; And searching for content having metadata associated with metadata input through the input items of the editor.
  • the information retrieval method may further include: separating the input search word into meaningful words; And parsing the separated search terms.
  • the editor providing step preferably uses a result of parsing in the parsing.
  • search information providing method the step of receiving information; Receiving an intention of an information provider who inputs the information; Providing the information provider with an editor suitable for the ultimate intention that integrates the interpretation result of the information with the intention of the information provider; And storing content integrating metadata input through the input items of the editor.
  • the search information providing method may further include: separating the input information into meaningful words; And parsing the separated words.
  • the editor providing step preferably uses a result of parsing in the parsing step.
  • the present invention by defining a different metadata for each content, and using an editor generated based on the metadata, by adopting a method for developing the information provision and search content in more detail, the existing search method It makes the search easier and more sophisticated.
  • the present invention grasps the searcher's intention from the information input by the searcher, induces detailed metadata input based on the identified intention, and searches in a directory that matches the searcher's intention using the input metadata. It can be done.
  • the information provider or searcher can enter the metadata more conveniently, and can also be provided with a guide on what kind of metadata should be input, thereby increasing the convenience of input. Will be.
  • the corresponding information may be classified for each directory, and the corresponding metadata may be matched and stored.
  • the intention of the searcher is grasped from the information input by the searcher, and the detailed metadata input is derived based on the intention of the searcher, but the metadata capable of generating the real data can be automatically inputted.
  • the information provider and the information searcher can be directly input the intention, so that the intention of the information provider and the information searcher can be more accurately understood, and ultimately, accurate information provision and retrieval are possible.
  • FIG. 1 is a diagram illustrating a search system according to an embodiment of the present invention
  • 3 is a diagram illustrating a Korean morpheme dictionary
  • FIG. 6 is a flowchart provided to explain a search method according to another embodiment of the present invention.
  • FIG. 7 is a diagram provided in the description of a geographic guidance service stored in an additional service database and an example of an additional service generated by an additional service generator;
  • FIG. 8 is a view provided to explain a method of providing an additional service of a different type from FIG. 7;
  • FIG. 9 is a view illustrating an example of an information providing / search window provided with an information search window and an information providing window;
  • FIG. 10 is a diagram illustrating a search system according to another embodiment of the present invention.
  • FIG. 13 is a view provided to explain a search method according to another embodiment of the present invention.
  • FIG. 14 to 16 are views provided for further explanation of the search method shown in FIG. 13;
  • FIG. 17 is a diagram illustrating a search system according to another embodiment of the present invention.
  • 20 is a diagram showing an example applied to the promotional offer for the candidate for the electronic vote.
  • searcher intent grasp 106 information monitor
  • search directory determiner 110 searcher
  • metadata DB 120 information provider intention grasp
  • Information Monitor 122 Information Parser
  • stemming dictionary 126 information input device
  • search result indicator 1001 information search box
  • stemming dictionary 1024 directory content crawler
  • Metadata DB 1714 Metadata Extractor for Search
  • FIG. 1 is a diagram illustrating a search system according to an exemplary embodiment of the present invention.
  • the blocks constituting the search system according to the present embodiment can be implemented in S / W as well as in H / W.
  • some of the blocks constituting the search system may be implemented as S / W and others as H / W.
  • the search system may classify and store information provided by an information provider for each directory according to the intention of the provider, determine the search intention of the information searcher, and perform a search for the information stored in the corresponding directory.
  • a consensus / customized search service is provided.
  • the metadata is data that can define in more detail and systematically the characteristics of the content to be provided / searched.
  • the metadata for a book includes details about the book, such as the book name, author, publisher, year of publication, price, and subject.
  • the metadata makes it possible to input and confirm through an editor having a predetermined frame.
  • the format of a frame can be implemented in a table form or a sentence form.
  • FIG. 2 is a diagram illustrating metadata for contents. As shown in FIG. 2, it can be seen that essential metadata is defined for contents of all regions.
  • the real estate sales 202 can confirm that the metadata, such as "sale”, “location”, “hope”, “feature”, “subway information” and “image information” is standardized.
  • Metadata for the contents shown in FIG. 2 is stored in the metadata DB 119 shown in FIG. 1.
  • the search system according to the present embodiment, as shown in Figure 1, the information search window 101, the search term input unit 102, search term stem processor 103, search term syntax interpreter 104, searcher intention grasp 105, information monitor 106, metadata extractor 107 for search, editor 108 for search, search directory determiner 109, searcher 110, metadata comparator 111, additional service database ( 112, supplementary service generator 113, search result generator 114, information storage 115, storage directory determiner 116, information providing editor 117, information providing metadata extractor 118, meta Data DB 119, information provider intent determiner 120, information monitor 121, information parser 122, syntax grammar rule dictionary 123, information stemmer 124, stemming dictionary 125, information An input unit 126, an information providing window 127, an information DB 128, and a search result indicator 129 are included.
  • additional service database 112, supplementary service generator 113, search result generator 114, information storage 115, storage directory determiner 116, information providing editor 117, information providing metadata extractor 118,
  • the information input unit 126 transfers the information input by the user to the information stemmer 124 through the information providing window 127.
  • the part-of-speech information of each word is made into a database.
  • extended information such as semantic information of each word, synonym information, and band foreign language is also made into a database.
  • the part-of-speech information contained in the morpheme dictionary 125 is referred to to separate the text into parts of speech, and the semantic information is used to grasp the intention of the content creator or the searcher.
  • synonym information is used to perform a wider range of extended searches, and band foreign languages are used to perform multilingual searches.
  • the morpheme dictionary 125 Since the information contained in the morpheme dictionary 125 is illustrated in FIG. 3, the morpheme dictionary 125 will be described in detail later with reference to FIG. 3.
  • the information stemmer 124 separates the text received from the information inputter 126 into units of meaningful words.
  • the term 'sense of words' refers to a part-of-speech, and accordingly, the information morph processor 124 may be understood to separate the text into parts of speech.
  • the information morpheme processor 124 may refer to the part-of-speech information on words that are databased in the morpheme dictionary 125 to separate text by parts of speech.
  • the information syntax interpreter 122 parses the information input by the user based on the result of the morpheme processing of the information stemmer 124.
  • the information syntax interpreter 122 refers to the grammar rules contained in the syntax grammar rule 123 in performing syntax analysis.
  • the information provider intention determiner 120 uses the syntax analysis result output from the information syntax interpreter 122 to grasp the intention of the information provider.
  • the information monitor 121 outputs the intention of the information provider identified by the information provider intention determiner 120 for the user to see. To this end, the information monitor 121 may use a graphical tool.
  • the information providing metadata extractor 118 extracts metadata about content corresponding to the intention of the information provider identified by the information provider intention determiner 120 from the metadata DB 119.
  • the information providing editor 117 generates an editor in which metadata extracted by the information providing metadata extractor 118 is an input item and provides the information to the information provider.
  • Storage directory determiner 116 determines a directory on information DB 128 suitable for storing content.
  • the storage directory determiner 116 may determine the directory by referring to the intention of the information provider identified by the information provider intention determiner 120.
  • the information store 115 stores the content incorporating the metadata generated by the information providing editor 117 in the information DB 128. At this time, the content is stored in the directory determined by the storage directory determiner 116.
  • the configurations described so far are used to generate and store information necessary for providing information.
  • the information searcher requests a search by inputting a search word
  • the configuration for enabling a more accurate search by identifying a search intention and inducing a more detailed search word input will be described in detail.
  • the search word input by the user includes not only words but also phrases or sentences.
  • the information search window 101 provides an input window through which a user can input a search word as a word, phrase, or sentence.
  • the search term input unit 102 transmits the search term input by the user to the search term stem processor 103 through the information search window 101.
  • the search term stem processor 103 divides the search term received from the search term inputter 102 into units of 'word meaning'.
  • the term 'sense of words' refers to a part-of-speech, and accordingly, the search term morpheme processor 103 may be understood as separating the search terms by parts of speech in the same manner as the information morpheme processor 124.
  • the search term morpheme processor 103 may refer to the part-of-speech information on words that are databased in the morpheme dictionary 125 to separate text by parts of speech.
  • the search term phrase interpreter 104 parses the search word input by the searcher based on the result of the morpheme processing of the search term stem processor 103.
  • the search term syntax interpreter 104 refers to the syntax grammar rule dictionary 123 in performing syntax analysis.
  • the searcher intention determiner 105 may determine the searcher's intention by using the parse result output from the search term parser 104.
  • the information monitor 106 outputs the searcher's intention grasped by the searcher intention determiner 105 for the user to see. To this end, the information monitor 106 may use graphical tools.
  • the search metadata extractor 107 extracts metadata about the content corresponding to the searcher's intention grasped by the searcher intention determiner 105 from the metadata DB 119.
  • the search editor 108 generates an editor in which metadata extracted by the search metadata extractor 107 is an input item and provides the searcher.
  • Search directory determiner 109 determines a directory on information DB 128 suitable for searching content.
  • the search directory determiner 109 may determine the directory with reference to the searcher's intention determined by the searcher intention determiner 105.
  • the search directory determiner 109 may further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 110 searches the information DB 128 for contents having the same metadata as the metadata input by the search editor 108. At this time, the search is performed in the directory determined by the search directory determiner 109.
  • the searcher 110 may of course perform an extended search that replaces the metadata input by the search editor 108 with the metadata of the agreement.
  • the searcher 110 may search not only metadata having the same structure and words as the metadata, but also content having only the same metadata as the structure and the words. That is, the searcher 110 may perform a partial search or a related search as well as the same search.
  • the metadata comparator 111 compares the metadata input through the search editor 108 with metadata constituting the content searched by the searcher 110, and selects and outputs only the content having high matching result. . As such, the comparison (matching degree of determination) is possible by comparing each of the metadata in the form of a table.
  • the additional service database 112 stores site information or a related advertisement service suitable for a searcher's search intent.
  • the additional service generator 113 generates an additional service related to the search key.
  • the supplementary service generator 113 uses an supplementary service suitable for a searcher's search intention among the supplementary services stored in the supplementary service database 112.
  • the additional service provided by the additional service database 112 and the additional service generator 113 may be implemented as a content context awareness service.
  • the content context-sensitive service includes a guide service, a trading service, an advertising service, an education service, a counseling service, a recommendation service, an administrative service, and the like.
  • the search result generator 114 adds the additional service generated by the additional service generator 113 to a degree of matching with the search result (contents) output from the metadata comparator 111.
  • the search result indicator 129 outputs the search result to which the additional service generated by the search result generator 114 is added through the screen and provides the result to the user.
  • the additional service generator 113 may not generate the additional service, or the search result generator 114 may not add the generated additional service even if the additional service generator 113 generates the additional service.
  • FIG. 3 illustrates an example of a morpheme dictionary in Korean.
  • the morpheme dictionary 125 includes 1) a word in a first column, 2) a part-of-speech information in a second column, and 3) a semantic information of a word in a third column.
  • column 4 a set of synonyms, synonyms, and / or representatives, 5) band English in column 5, 6) band Japanese in column 6, and 7) band Chinese in column 7. , Each listed.
  • the information morpheme processor 124 is used to morph text
  • the search term morpheme 103 is used to morph the search term.
  • morphological processing is to indicate what meaningful words the elements of a given sentence consist of. For example, when stemming "go to school”, it is morpheme processing to divide the word boundary as "school + goes to + goes to school.”
  • the information to be used is the part-of-speech information stored in the morpheme dictionary 125 to examine the possible relations between each part-of-speech, and as a result of the processing, such as "school / noun + to / investigative + verb / verb / mother".
  • linguistic statistics such as "word frequency” and "sentence number” can be obtained as secondary information of morphological processing, and semantic information, synonym information, and band foreign language can be simultaneously output.
  • the classification presented above is only one example and is not fixed. Since the meaning of words changes from time to time, the classification of meanings is not fixed but can change according to the change of the times.
  • the lexical dictionary by thesaurus classification may be referred.
  • Nom 125-5 may know that part-of-speech information is a “noun”, semantic information is “despite”, and synonym information is “over”.
  • Semantic information and synonym information may be used to expand and expand the search. For example, when “Rhee Syngman” is used as a search word, it is possible to further provide a search result related to "Rhee Syngman” as well as a search result related to "Korean President".
  • carbon dioxide measures when used as a search term, the search results for "carbon dioxide measures” as well as “harmful substances”, “CO 2 measures” and “global warming measures” can be further provided. Do.
  • the morpheme dictionary 125 contains semantic information and synonym information in addition to the part-of-speech information, rich information retrieval is possible.
  • Syntactic analysis is the process of interpreting the structure of each meaningful word that constitutes a sentence.
  • Syntactic analysis uses grammar theory to describe the natural language.
  • Grammar theories describing natural languages include grammar, grammar, dependence, and lexical grammar.
  • the input sentences that have completed the morpheme processing 401 shown in FIG. 4 are separated into meaningful word units, and the parts of speech information is added to each of the separated words (402).
  • Part-of-speech information includes ⁇ nouns, pronouns, investigations, adjectives, adverbs, investigations... ⁇ There are about 10-12 parts of speech.
  • each syntax expression expression may be output 404 according to a grammar theory. Accordingly, the expression 405 by the part-of-speech information, the expression 406 by the semantic information, and the expression 407 by the synonym / phrase can be output.
  • FIG. 5 is a flowchart provided to explain a search method according to another embodiment of the present invention.
  • the information inputter 126 transmits the information input by the user to the information stemmer 124 (501). .
  • the information morpheme processor 124 refers to the morpheme dictionary 125 and separates "used car sales" by parts of speech and outputs it as "used car / dig / sell" (502).
  • the part-of-speech information and semantic information are output together as a result of the morpheme processing.
  • the part-of-speech information is a noun, a verb, a mother, and the meaning information is a used car, a sale, and respect.
  • the information parser 122 performs syntax analysis on the result of the morpheme processing, and outputs the result (used car ⁇ sale) (503).
  • the information provider intention determiner 120 uses the syntax analysis result output from the information parser 122 to identify the intention of the information provider as 'used car sale' (504).
  • the information providing metadata extractor 118 extracts metadata about the content suitable for 'used car sales', which is the intention of the information provider, from the metadata DB 119 (505).
  • the information providing editor 117 generates an editor in which the extracted metadata are input items and provides them to the information provider (506). The information provider then enters the metadata via the provided editor (507).
  • the storage directory determiner 116 determines a directory on the information DB 128 suitable for storing the content, and adds a directory index key (used car, sold). This is to allow the content to be stored in the directory. Meanwhile, the storage directory determiner 116 may add a user ID in addition to the directory index key (used car, sale) (508).
  • the information storage unit 115 stores the content integrating the metadata input by the information providing editor 117 in the information DB 128. At this time, the content is stored in the directory determined by the storage directory determiner 116.
  • FIG. 6 is a view provided to explain a search method according to another embodiment of the present invention.
  • the searcher's search intention is grasped, and detailed and accurate search is possible based on the identified searcher's intention.
  • the search word input by the user includes not only words but also phrases or sentences.
  • the query morpheme processor 103 separates the inputted search words by parts of speech (used used cars / companies). And the part-of-speech information and semantic information of (noun / used car, company / purchase, mother / grand) are added and output (602).
  • search term syntax interpreter 104 performs syntax analysis based on the result of the morpheme processing, and outputs (used difference ⁇ purchase) as a result (603).
  • the searcher intention determiner 105 determines the searcher's intention as 'used-to-buy' using the syntax analysis result (604).
  • the search metadata extractor 107 extracts metadata about content suitable for the 'used car purchase', which is the intention of the searcher, from the metadata DB 119, and the search editor 108 searches the metadata extractor for search ( In step 605, an editor in which metadata extracted by 107 is an input item is generated and provided to a searcher.
  • the searcher then enters metadata 606 via the provided editor.
  • metadata 606 via the provided editor.
  • Search directory determiner 109 determines a directory on information DB 128 suitable for searching for content, and searcher 110 retrieves content having the same metadata as the metadata input by search editor 108. The information is retrieved from the DB 128 (607). The search is performed in the directory determined by the search directory determiner 109.
  • the search directory determiner 109 determines a directory by referring to the searcher's intention determined by the searcher intention determiner 105, and may further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 110 may perform a partial search or a related search.
  • the metadata comparator 111 compares the metadata input through the search editor 108 with metadata constituting the content searched by the searcher 110 (608). In operation 609, the metadata comparator 111 selects and outputs only the contents having high matching result.
  • the searcher's intention is identified from the information entered by the searcher, the detailed metadata input is derived based on the identified intention, and the input metadata is used to perform a search in a directory that matches the searcher's intention.
  • the process has been described in detail.
  • the metadata is input using a standardized or standardized editor. Accordingly, the information provider or the searcher may enter the metadata more conveniently, and may also be provided with a guide on what kind of metadata should be input, thereby increasing the convenience of the input.
  • the metadata input method using such a standard editor can be applied to a device such as a mobile phone or an IPTV.
  • conditional search is to perform a search with the search term "used cars of 1.2 million won or less".
  • FIG. 7 is a diagram of a geographic guidance service stored in the supplementary service DB 112 and an example of an additional service generated by the supplementary service generator 113.
  • the input sentence 701 is morphed by the search term stem processor 103, separated into " near / delicious /// pantry / restaurant / silver " (702), and " nearby / near " Noun / Current Location, Delicious / Adjective / Food Evaluation, Silver / Investigation / Formula, Italy / Noun / Country, Restaurant / Noun / Restaurant, Silver / Investigation / Presentation "(703) is output.
  • the search term syntax interpreter 104 parses the morpheme processing result, and the searcher intention determiner 105 determines the searcher's intention through the syntax interpretation result. Specifically, the searcher intention determiner 105 recognizes the search request because the meaning information of the context-sensitive word 'silver' represents 'present', and the context-sensitive word “nearby”. Is understood to mean that the current location that can be identified by the GPS should be acquired, and the Italian restaurant is intended to require a search of a restaurant database.
  • the supplementary service generator 113 detects the current position using the GPS (704), the searcher 110 performs a search for a delicious Italian restaurant (705), and the supplementary service generator 113 executes a map. In operation 706, a map displaying delicious Italian restaurants found on the map on which the current location is displayed is output (707).
  • the illustrated additional service is to provide various additional information related to a specific word and a subject included in the text output as a search result.
  • various kinds of information such as organization information 801, advertisement 802, person information 803, topic topic information 804, and company information 805 stored in the additional service database 112 may be utilized. Of course, it can be obtained from other databases connected through the network.
  • FIG. 9 is a diagram illustrating an example of an information providing / search window provided with an information search window and an information providing window.
  • the input window 901 is a window used to input a search word
  • the information providing button 902 is a button used to provide / register information input in the input window 901.
  • the information retrieval button 903 is a button used to command information retrieval for the search word entered in the input window 901.
  • buttons 904 provided below are buttons used to set a search method and a search result providing method.
  • the "exact search” button shown in FIG. 9 is a button used to set the search method to a perfect search
  • the "ad allow” button is used to allow the display of advertisements related to the search results with the search results.
  • the "Allow related service provision” button is a button used to allow additional information on words and phrases included in a search result.
  • FIG. 10 is a diagram illustrating a search system according to another embodiment of the present invention.
  • the blocks constituting the search system according to the present embodiment can be implemented in S / W as well as in H / W.
  • some of the blocks constituting the search system may be implemented as S / W and others as H / W.
  • the search system includes an information search window 1001, a search term inputter 1002, a search term stemmer 1003, a search term syntax interpreter 1004, and a searcher intention determiner ( 1005), information monitor 1006, metadata extractor 1007 for search, editor 1008 for search, searcher 1009, metadata comparator 1010, supplementary service database 1011, supplementary service generator 1012 , Search result generator 1013, information store 1014, information providing editor 1015, information providing metadata extractor 1016, metadata DB 1017, content provider intention finder 1018, information Monitor 1019, parser 1020, syntax grammar rule 1021, stemmer 1022, stemmer dictionary 1023, directory content crawler 1024, information DB 1025, search result indicator 1026 , A search directory determiner 1027 and a storage directory determiner 1028.
  • the directory content crawler 1024 collects text included in content classified by directory.
  • the text collected by directory content crawler 1024 is passed to stemmer 1022, which will be described later.
  • contents are stored in a directory, such as job offer information 21, college entrance examination information 13, real estate 23, finance 24, automobile 25, movie theater 26, shopping 27, Traffic information 28, travel information 29, recommendation 30, etc. are assumed, but other directories may be applied.
  • the morpheme dictionary 1023 may be implemented as the same as the morpheme dictionary 125 illustrated in FIG. 1.
  • the morpheme processor 1022 refers to the morpheme dictionary 1023 and separates and outputs the text transmitted from the directory content crawler 1024 by parts of speech.
  • the syntax interpreter 1020 performs syntax analysis on the text included in the content based on the stemming result of the stemmer 84. In performing the syntax analysis, the parser 1020 refers to the syntax grammar rule 1021.
  • the content provider intention determiner 1018 uses the syntax analysis result output from the syntax interpreter 1020 to grasp the intention of the content creator.
  • the information monitor 1019 outputs the intention of the content creator identified by the content provider intention determiner 1018 for the user to see. To this end, the information monitor 1019 may use graphical tools.
  • the information-providing metadata extractor 1016 extracts metadata about the content corresponding to the intention of the content provider identified by the content provider intention determiner 1018 from the metadata DB 1017.
  • the information providing editor 1015 generates an editor in which metadata extracted by the information providing metadata extractor 1016 is an input item and provides the information to the information provider.
  • the storage directory determiner 1028 determines a directory on the information DB 1025 suitable for storing content.
  • the storage directory determiner 1028 may determine the directory by referring to the intention of the content provider identified by the content provider intention determiner 1020.
  • the information store 1014 stores the content integrating the metadata generated by the information providing editor 1015 in the information DB 1025. At this time, the content is stored in the directory determined by the storage directory determiner 1028.
  • the components described so far are components used to collect content and store the collected contents based on the intention of the creator.
  • the information searcher requests a search by inputting a search word
  • the configurations for enabling a more accurate search by identifying a search intention and inducing a more detailed search word input will be described in detail.
  • the search word input by the user includes not only words but also phrases or sentences.
  • the information search window 1001 provides an input window through which a user can input a search word as a word, phrase, or sentence.
  • the search term input unit 1002 transmits the search term input by the user to the search term stem processor 1003 through the information search window 1001.
  • the search term morpheme processor 1003 refers to the morpheme dictionary 1023, and separates and outputs the search term received from the search term inputter 1002 for each part of speech.
  • the search term syntax interpreter 1004 performs syntax analysis on the search term input by the searcher based on the result of the morpheme processing of the search term stem processor 1003.
  • the search term parser 1004 refers to a syntax grammar rule 1021 in performing syntax analysis.
  • the searcher intention determiner 1005 detects the searcher's intention by using the syntax interpretation result output from the search term syntax interpreter 1004.
  • the information monitor 1006 outputs the searcher's intention grasped by the searcher intention determiner 1005 for the user to see. To this end, the information monitor 1006 may use graphical tools.
  • the search metadata extractor 1007 extracts metadata about the content corresponding to the searcher's intention grasped by the searcher intention determiner 1005 from the metadata DB 1017.
  • the search editor 1008 generates an editor in which metadata extracted by the search metadata extractor 1007 is an input item and provides the searcher.
  • Search directory determiner 1027 determines a directory on information DB 1025 suitable for searching for content.
  • the search directory determiner 1027 may determine the directory by referring to the searcher's intention determined by the searcher intention determiner 1005.
  • the search directory determiner 1027 can further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 1009 searches the information DB 1025 for content having the same metadata as the metadata input by the search editor 1008. At this time, the search is performed in the directory determined by the search directory determiner 1027.
  • the searcher 1009 may of course perform an extended search that replaces the metadata input by the search editor 1008 with metadata of a consent and searches.
  • the searcher 1009 may search not only metadata having the same structure and words as the metadata, but also contents having only the same metadata as the structure and the words. That is, the searcher 1009 can perform a partial search or a related search as well as the same search.
  • the metadata comparator 1010 compares the metadata input through the search editor 1008 with metadata constituting the content searched by the searcher 1010, and selects and outputs only the content having high matching result. do. As such, the comparison (matching degree of determination) is possible by comparing each of the metadata in the form of a table.
  • the comparison is possible by comparing each of the metadata in the form of a table.
  • the supplementary service database 1011 stores means for providing site information or related advertisement service suitable for a searcher's search intent.
  • the additional service generator 1012 generates an additional service related to the search key. To this end, the supplementary service generator 1012 uses an supplementary service suitable for a searcher's search intention among the supplementary services stored in the supplementary service database 1011.
  • the supplementary service provided by the supplementary service database 1011 and the supplementary service generator 1012 may be implemented as a content context awareness service.
  • the content context-sensitive service includes a guide service, a trading service, an advertisement service, an education service, a counseling service, a recommendation service, and the like.
  • the search result generator 1013 adds an additional service generated by the additional service generator 1012 to match the search result output from the metadata comparator 1010.
  • the search result indicator 1026 outputs the search result to which the additional service generated by the search result generator 1013 is added through the screen and provides the result to the user.
  • the additional service generator 1012 may not generate the additional service, or the search result generator 1013 may not add the generated additional service even if the additional service generator 1012 is generated.
  • FIG. 11 is a view provided to explain a search method according to another embodiment of the present invention.
  • the directory content crawler 1024 collects recommendation text posted in the recommendation directory 30 and delivers the recommendation text to the stemmer processor 1022.
  • the morpheme processor 1022 then performs a morpheme processing with reference to the morpheme dictionary 1023.
  • the result of the morpheme processing by the morpheme processor 1022 is as shown in Fig. 11B.
  • the syntax interpreter 1020 performs syntax analysis on FIG. 11B.
  • the result of syntax analysis by the syntax interpreter 1020 is as shown in FIG.
  • the content provider intention determiner 1018 determines the intention of the provider based on FIG. 11C.
  • the intention of the provider identified by the content provider intention determiner 1018 is as shown in FIG.
  • the information providing metadata extractor 1016 extracts metadata about the content corresponding to the intention of the provider from the metadata DB 1017.
  • the information providing editor 1015 generates an editor in which the extracted metadata are input items and provides them to the user.
  • the content corresponding to "stone feast ⁇ place ⁇ recommendation" is "provide stone feast place”.
  • the information providing editor 1015 summarizes the intention of the content provider identified by the content provider intention determiner 1018 as shown in FIG. 11E.
  • the information providing editor 1015 automatically inputs corresponding metadata to each item of the editor shown in FIG. 12A, and the input result is as shown in FIG. 12B.
  • the storage directory determiner 1028 determines a directory on the information DB 1025 suitable for storing content.
  • the storage directory determiner 1028 may determine the directory by referring to the intention of the content provider identified by the information provider intention determiner 1018.
  • the information store 1014 stores the content integrating the metadata generated by the information providing editor 1015 in the information DB 1025. At this time, the content is stored in the directory determined by the storage directory determiner 1028.
  • the corresponding information is classified for each directory based on the intention of the content provider, and the corresponding metadata may be matched and stored.
  • the searcher 13 is a view provided to explain a search method according to another embodiment of the present invention.
  • the searcher's search intention is grasped, and detailed and accurate search is possible based on the identified searcher's intention.
  • the search word input by the user includes not only words but also phrases or sentences.
  • the query morpheme processor 1003 separates the input search word by parts of speech. (1302), (noun / present, noun / day, adjective / crush, noun / musical, noun / recommendation, verb / request) And semantic information are added and output (1303).
  • the search term syntax interpreter 1004 performs syntax analysis based on the result of the morpheme processing, and outputs the result (from ⁇ Saturday, highlight ⁇ musical, ⁇ recommendation, ⁇ wind) as a result (1304).
  • search term syntax interpreter 1004 performs context-sensitive processing on the former, which will be described in detail below.
  • 14 are contextual words representing times, which may be contained in a morpheme dictionary 1023. As shown in FIG. 14, semantic information of each language is defined as “past”, “present”, “future”, and the like.
  • FIG. 15 is a diagram illustrating that the current time is designated by the year, month, day, day of the week, hour, minute, and second, and managed by the system.
  • Fig. 16 shows a method of calculating the language expression "this Saturday” quantitatively at the present time.
  • it is the actual quantitative time in the language expression that represents the time, so when morphing "this Saturday", the day of the current time is obtained from the system calendar and "Wednesday” from the semantic information of "this / current, Saturday / Saturday.”
  • the current system "Saturday” is three days after "Wed ⁇ Thu ⁇ Fri ⁇ Sat”, so if you add 3 days to the current date of November 6, 2008, you can generate the real data of November 9, 2008. .
  • the searcher intention determiner 1005 grasps the searcher's intention as 'musical ⁇ recommend ⁇ request' using the syntax analysis result (1308).
  • the search metadata extractor 1007 extracts metadata about content suitable for the 'musical recommendation request', which is the intention of the searcher, from the metadata DB 1017, and the search editor 1008 extracts the search metadata extractor.
  • the searcher then enters the metadata through the provided editor (1312).
  • Search directory determiner 1027 determines a directory on information DB 1025 suitable for searching content, and searcher 1009 retrieves content having the same metadata as the metadata input by search editor 1008. The information is retrieved from the DB 1025 (1313). The search is performed in the directory determined by the search directory determiner 1027.
  • the search directory determiner 1027 determines a directory by referring to the searcher's intention determined by the searcher intention determiner 1005, and may further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 1009 may perform a partial search or a related search.
  • the metadata comparator 1010 compares the metadata input through the search editor 1008 with metadata constituting the content searched by the searcher 1009 (1314). In operation 1315, the metadata comparator 1010 selects and outputs only the contents having a high match.
  • the searcher's intention is identified from the information entered by the searcher, and the detailed metadata input is derived based on the identified intention, but the metadata capable of generating real data is automatically entered.
  • the process of performing a search in a directory that matches the intention of the searcher has been described in detail.
  • the intention of the information provider or the information searcher is automatically detected by analyzing the input language expression.
  • a method of allowing the information provider or the information searcher to directly input the information provider and the information searcher is not automatically understood. This is to more accurately grasp the intention of the information provider and the information searcher.
  • FIG. 17 is a diagram illustrating a search system according to an embodiment to which the above is applied.
  • the blocks constituting the search system according to the present embodiment can be implemented in S / W as well as in H / W.
  • some of the blocks constituting the search system may be implemented as S / W and others as H / W.
  • the search system includes an information providing / search window 1701, a morpheme processor 1702, a morpheme dictionary 1703, a syntax interpreter 1704, and a syntax grammar rule dictionary 1705. ), Intent designator 1706, information monitor 1707, information providing metadata extractor 1708, information providing editor 1709, storage directory determiner 1710, information storage 1711, information DB ( 1712, metadata DB 1713, metadata extractor 1714 for search, editor 1715 for search, search directory determiner 1716, searcher 1917, metadata comparator 1718, search result generator 1917 ), A search result indicator 1720, an additional service database 1721, and an additional service generator 1722.
  • the information providing / search window 1701 is a user interface used for inputting information to be registered by the information provider or for inputting a search word by the information searcher.
  • the information providing / search window 1701 is provided with an input window 1701-1, an information providing button 1701-2, and an information searching button 1701-3.
  • the input window 1701-1 is a window used to input information or a search word to be provided, and the information and the search word may be input as words, phrases, or sentences in the input window 1701-1.
  • the information providing button 1701-2 is a button used to provide / register information input to the input window 1701-1, and the information search button 1701-3 is input to the input window 1701-1. This button is used to command information retrieval for the searched keyword.
  • Information or search word input through the information providing / search window 1701 is transferred to the stemmer 1702.
  • the morpheme dictionary 1703 may be implemented as the same as the morpheme dictionary 125 illustrated in FIG. 1.
  • the morpheme processor 1702 refers to the morpheme dictionary 1023 and separately outputs information or a search word input through the information providing / search window 1701 by parts of speech.
  • the syntax interpreter 1704 performs syntax analysis on information or a search word input by a user based on the stemming result of the stemmer 1702.
  • the syntax parser 1704 refers to the grammar rules contained in the syntax grammar rule 1705 in performing syntax analysis.
  • the intention designator 1706 provides a user interface means for directly designating the intention of the information provider or the intention of the information searcher, and outputs the ultimate intention by integrating the designated intention in the parse result.
  • the information monitor 1707 outputs the ultimate intention output from the intention designator 1706 for the user to see. To this end, the information monitor 1707 may use graphical tools.
  • the information-providing metadata extractor 1708 extracts metadata about the content corresponding to the ultimate intention of the information provider output from the intention designator 1706 from the metadata DB 1713.
  • the information providing editor 1709 generates an editor in which metadata extracted by the information providing metadata extractor 1708 is an input item and provides the information to the information provider.
  • the storage directory determiner 1710 determines a directory on the information DB 1712 suitable for storing content. In this case, the storage directory determiner 1710 may determine a directory by referring to the ultimate intention of the information provider identified by the intention designator 1706.
  • the information storage unit 1711 stores in the information DB 1712 content in which the metadata generated by the information providing editor 1709 is integrated. At this time, the content is stored in the directory determined by the storage directory determiner 1710.
  • the metadata extractor 1714 for searching extracts metadata about the content that matches the ultimate intention of the information searcher output from the intention designator 1706 from the metadata DB 1713.
  • the search editor 1715 generates an editor in which metadata extracted by the search metadata extractor 1714 is an input item and provides the searcher.
  • Search directory determiner 1716 determines a directory on information DB 1712 suitable for searching for content. In this case, the search directory determiner 1716 may determine the directory by referring to the ultimate intention of the searcher output from the intention designator 1706.
  • the search directory determiner 1716 may further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 1917 searches the information DB 1712 for content having the same metadata as the metadata input by the search editor 1715. At this time, the search is performed in the directory determined by the search directory determiner 1716.
  • the searcher 1917 may of course perform an extended search that replaces the metadata input by the search editor 1715 with metadata of the agreement.
  • the searcher 1917 may search not only metadata having the same structure and words as the metadata, but also contents having only the same metadata as the structure and the words. That is, the searcher 1917 can perform a partial search or a related search as well as the same search.
  • the metadata comparator 1718 compares the metadata input through the search editor 1715 with metadata constituting the content searched by the searcher 1917, and selects and outputs only the contents having high matching result. . As such, the comparison (matching degree of determination) is possible by comparing each of the metadata in the form of a table.
  • the additional service database 1721 stores site information suitable for the searcher's search intention or means for providing related advertisement services.
  • the additional service generator 1722 generates an additional service related to the search key. To this end, the supplementary service generator 1722 uses an supplementary service suitable for a searcher's search intention among the supplementary services stored in the supplementary service database 1721.
  • the additional service provided by the additional service database 1721 and the additional service generator 1722 may be implemented as a content context awareness service.
  • the content context-sensitive service includes a guide service, a trading service, an advertising service, an education service, a counseling service, a recommendation service, an administrative service, and the like.
  • the search result generator 1725 adds the additional service generated by the additional service generator 1722 to match the search result (contents) output from the metadata comparator 1718.
  • the search result indicator 1720 outputs the search result to which the additional service generated by the search result generator 1719 is added to the user through the screen.
  • the additional service generator 1722 may not generate the additional service or even if the additional service generator 1722 does not add the generated additional service.
  • the stemming dictionary 1703 is divided into parts of speech and output as a class / timetable, with reference to the morpheme dictionary 1703.
  • the syntax interpreter 1704 performs syntax analysis on the result of the morpheme processing, and outputs the result (class ⁇ timetable) (1803).
  • the intention designator 1706 is the ultimate intention "class ⁇ timetable which incorporates the intention specified in the parse result. ⁇ provide " (1806).
  • the information providing metadata extractor 1708 then extracts 1807 metadata about the content suitable for "Teaching ⁇ Timetable ⁇ Providing", which is the ultimate intention of the information provider, from the metadata DB 1713.
  • the information providing editor 1709 generates an editor in which the extracted metadata are input items and provides the information to the information provider (1808). The information provider then enters the metadata via the provided editor (1809).
  • the storage directory determiner 1710 determines 1810 a directory on the information DB 1712 suitable for storing the content.
  • the information storage unit 1711 stores the content in which the metadata inputted by the information providing editor 1709 is integrated in the information DB 1712. At this time, the content is stored in the directory determined by the storage directory determiner 1710.
  • the information searcher enables detailed and accurate search based on the search word and the intention.
  • the search word input by the user includes not only words but also phrases or sentences.
  • the stemmer 1702 Refers to the morpheme dictionary 1703 and separates the "schedule table” by parts of speech and outputs it as “schedule / table” (1902).
  • the syntax interpreter 1704 then parses the result of the morpheme processing and outputs the result (Schedule-> Table) (1903).
  • the intention designator 1706 is the ultimate intention "schedule ⁇ table which incorporates the intention specified in the parse result. Output the search " (1906).
  • the search metadata extractor 1714 extracts metadata about content suitable for the searcher's ultimate intention of 'schedule ⁇ table ⁇ search' from the metadata DB 1713, and the search editor 1715 searches.
  • the application metadata extractor 1714 generates an editor in which the extracted metadata is an input item, and provides the editor to the searcher (1908).
  • the searcher then enters metadata 1909 via the provided editor.
  • the search directory determiner 1716 determines a directory on the information DB 1712 suitable for searching for content (1910), and the searcher 1917 uses the same metadata as the metadata input by the search editor 1715.
  • the retrieved content is retrieved from the information DB 1712 (1911).
  • the search is performed in the directory determined by the search directory determiner 1716.
  • the search directory determiner 1716 determines a directory by referring to the searcher's intention determined by the intention designator 1706, and may further determine directories similar to the determined directory. This is to allow a wider search.
  • the searcher 1917 may perform a partial search or a related search.
  • the metadata comparator 1718 compares the metadata input through the search editor 1715 with metadata constituting the content searched by the searcher 1917 (1912).
  • the metadata comparator 1718 selects and outputs only the contents having a high match as a result of the comparison (1913).
  • a user inputs "providing candidates for promotion" to enter metadata in an editor provided by an information provider and an editor created after morphing, parsing, specifying intent, and extracting metadata. The results are shown in FIG. 20.
  • the promotional material for the candidate can be distributed to the voters using a PC, a mobile phone, or the like. According to this, it is possible to cheaply and quickly provide a candidate promotional material by the paper poster currently in use.
  • the embodiments described so far can be implemented in mobile information devices such as mobile phones as well as other information devices.
  • the information providing button and the information searching button may correspond to / assign a specific button (key) of mobile information devices such as a mobile phone as well as other information devices.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법이 제공된다. 본 정보 검색방법은, 검색어에 대한 해석결과를 이용하여 파악한 검색자의 의도에 맞는 편집기를 제공하고, 편집기를 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색한다. 이에 의해, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색을 수행할 수 있게 된다.

Description

사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
본 발명은 자연언어의 단어, 구, 문장을 검색어로 하여 정보를 제공하고 검색하되 사용자의 의도에 기반하여 보다 정확한 정보 제공과 검색을 가능하게 하는 다기능 정보 검색방법 및 시스템에 관한 것이다.
최근 정보 및 컨텐츠의 제공자, 소비자의 확대 그리고 다양한 정보 제공 매체의 융합 기술에 대한 개발 요구가 높다. 예를 들면, 유무선 방송 통신기술의 융합 기술, 통합 정보 웹서비스 기술 및 다양한 사용자 계층에 편리한 사용자 인터페이스 기술 개발이 대표적인 것들이다. 이러한 기술의 구체적 내용은 제공되는 또는 제공하는 컨텐츠, 정보의 질 및 의미의 해석을 컴퓨터로 자동 해석하여 정보 컨텐츠 이용자의 취향과 의도에 맞게 그리고 편리하고 다양한 방법으로 이들 정보 컨텐츠가 제시, 제공되는 정보시장기술이 기대되고 있다.
예를 들면, 한국특허 공개번호 제10-2006-0043333호 (데이터의 의도를 판정하고 의도에 기초하여 데이터에 응답하는 시스템 및 방법)은 데이터 핸들링을 용이하게 하는 시스템으로서, 데이터를 수신하는 컴포넌트 및 상기 데이터의 의도를 판정하고, 상기 의도에 기초하여 적어도 상기 데이터의 부분집합을 재 체계화하며, 상기 재 체계화된 데이터를 사용자에게 자동적으로 제시하는 데이터 관리자를 포함하는 시스템을 목적으로, 상기 데이터 관리자는 상기 데이터를 분석하고, 상기 데이터를 관련 특징을 갖는 하나 이상의 집합으로 분류하며, 상기 데이터의 집합 중 적어도 하나의 집합으로부터 특징들을 추출하여 상기 데이터의 부분집합을 형성하는 시스템으로, 또, 상기 데이터 관리자는, 상기 데이터 분석을 용이하게 하기 위해, 상기 데이터의 메타데이터, 속성, 내용, 문맥, 키워드, 이력, 경험(heuristics), 추론, 규칙, 구분(demarcation), 시간, 요일, 관련된 핸들링 비용, 관련된 핸들링 이득, 소스 중 적어도 하나를 이용하며, 상기 특징은 구문론적 구조, 구문론적 속성, 언어적 구조 및 언어적 속성 중 하나에 적어도 부분적으로 기초하여 추출되는 시스템으로, 상기 언어적 특징은 문장에서 발생하는 단어, 문장에서 발생하는 이중음자 단어(Word bigram) 및 문장에서 발생하는 삼중음자 단어(Word trigram) 중 적어도 하나를 포함하는 시스템을 목적으로 하고 있다.
한국특허 공개번호 제2002-0028593호 (유해 단어 차단 방법)은 컴퓨터 이용자가 회원정보를 입력하고 관리서버에 접속하는 단계, 상기 컴퓨터 이용자는 상기 관리서버가 디스플레이 시킨 정보입력화면에 등록/전송을 위한 정보를 입력하는 단계, 상기 관리서버의 유해단어차단모듈은 상기 컴퓨터 이용자가 입력한 상기 정보에 유해 단어가 포함되어 있는지를 판단하는 단계, 상기 관리서버는 상기 유해단어차단모듈의 판단 결과에 따라서 컴퓨터 이용자와 연결을 차단하거나, 상기 정보를 등록/전송하는 단계로 이루어지는 것을 특징으로 하는 유해 단어 차단 방법을 특징으로 하고 있으나, 유해 단어에 대한 정의를 은어, 비속어, 성적 모독 또는 인격 모독에 관련한 것을 의미한다 하고 전송되는 메시지에 유해한 단어가 포함되어 있지 않을 경우, 채팅을 계속 진행하는 처리 모듈로 구성되어 있다. 상기 특허는 채팅 상의 메시지 속에 유해단어 포함 여부를 중심으로 한 것이다.
한국특허 공개번호 제10-2006-0062300호 (유해 사이트 차단을 위한 다단계 텍스트 필터링 방법)은 음란사이트를 차단하기 위한 자료로 사용할 텍스트를 그 음란성 정도로 구분하여 적어도 하나 이상의 집합으로 구분한 후 데이터베이스화하는 단계, 접속중인 웹 사이트로부터 텍스트를 수집하는 단계 및 상기 텍스트를 상기 집합내의 텍스트들과 비교하여 적어도 하나 이상의 다단계 필터링을 수행하여 상기 접속중인 웹사이트의 차단여부를 결정하는 단계를 포함하는 것을 특징으로 하는 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법으로 텍스트 내에 음란성 정도에 따라 유해사이트를 차단하는 것이다.
한국특허 공개번호 제10-2006-0087735호 (개선된 스팸성 메시지 필터링을 제공하는 시스템 및 방법)은 스팸성 메시지 필터링을 제공하는 시스템에 있어서, 발신자 단말기로부터 사용자 단말기로 전송되기 위한 메시지를 수신하는 무선 네트워크 서버와, 자연어 문장의 사용례들과 이들 사용례에 대한 부속 정보들이 저장되어 있으며, 이를 각각의 사용 용도에 따라 카테고리별로 분류 가능한 대규모 언어 DB(Database)인 코퍼스DB와, 상기 무선 네트워크 서버에서 상기 메시지의 수신을 감지하고, 상기 수신 메시지에 포함된 문장으로부터 적어도 하나의 명사형 키워드를 추출하는 어휘 분석부와, 상기 추출된 명사형 키워드들 중 어느 하나를 선택하여, 사용자가 스팸 메시지로 설정한 적어도 하나의 상기 코퍼스 DB의 사용자 카테고리들 각각에 포함된 문장들에서 사용된 스팸 빈도수들과, 상기 사용자 카테고리가 아닌 카테고리에 포함된 문장들에서 사용된 일반 빈도수를 검색하는 코퍼스 검색부와, 상기 적어도 하나의 스팸 빈도수와 상기 일반 빈도수가 입력되면, 상기 선택된 명사형 키워드가 포함된 문장이 상기 사용자 카테고리에 포함될 확률을 산출하는 확률 계산부와, 상기 어휘 분석부와 상기 코퍼스 검색부를 제어하여 상기 확률 계산부로부터 각각의 명사형 키워드마다의 스팸 메시지 포함 확률이 산출되도록 하고, 산출된 확률들에 대한 통계치를 산출하여 상기 수신 메시지가 스팸 메시지인지 아닌지를 판단하며, 판단 결과를 상기 무선 네트워크 서버로 전송하는 필터링 제어부를 구비하는 것을 특징으로 하는 개선된 스팸성 메시지 필터링을 제공하는 시스템으로 메시지의 스팸성을 평가, 분석, 분류하는 방법론이다.
한국특허 공개번호 제10-2008-0000416호 (유해 메시지 여과 시스템과 그 여과 방법 및 이를 기록한 기록매체)은 네트워크를 통하여 연결된 클라이언트로부터 수신되는 메시지를 저장하는 데이터베이스를 구비하고 유해 메시지를 여과하는 시스템에 있어서, 상기 메시지를 수신하는 메시지 수신수단, 수신된 상기 메시지에서 다수의 단어를 추출하는 단어 추출수단, 추출된 상기 다수의 단어를 이용하여 상기 메시지의 유해 메시지 여부를 판단하고 상기 데이터베이스에 저장하는 평가수단을 포함하고, 상기 평가수단은 상기 데이터베이스에 저장된 단어 평가값을 이용하여 상기 메시지의 유해 메시지 여부를 판단하고 상기 메시지를 다수의 유해 메시지 분류로 세분화하는 것을 특징으로 하는 인터넷 커뮤니티 상의 유해 메시지 여과 시스템으로 메시지의 유해 여부를 분류하는 기술 분야이다.
한국특허 등록번호 제10-0484944호 (국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치)는 원시문장 형태소 분석 결과로부터 기본 구문 구조 생성 규칙, 의존 구문 규칙, 형태소 의미 전자 사전, 의미 격틀 및 용언구 의미 공기사전을 이용하여 단문을 인식하는 단문 인식수단, 의미 격틀 및 용언구 의미 공기사전을 이용하여 보조사에 대한 격 복원을 수행하는 보조사 격 복원수단, 용언구 공기사전을 이용하여 용언의 논항 명사에 대한 의미를 결정하는 논항 명사 의미 결정수단, 및 명사/조사/명사, 명사/명사의 공기정보로 구성된 명사구 의미 공기사전을 이용하여 명사구내의 명사 및 복합 명사내의 명사들에 대한 의미를 결정하는 명사구 의미 결정수단, 을 포함하는 것을 특징으로 국소 구문관계 및 의미 공기사전에 기반한 형태소 의미 자동 태깅장치에 관한 것으로 언어학적 견지에서 구문 구조 정보를 이용하여 기존의 다른 의미 모호성 장치들보다 정확한 공기 정보인 구문 문맥 정보를 이용함으로써 명사의 의미 모호성을 해결하는 방법을 제시하고 있다.
한국특허 등록번호 제10-0757951호 (웹페이지의 형태소 분석을 통한 검색 방법)은 컴퓨터, 노트북, 핸드폰, PDA 등의 클라이언트와, 상기 클라이언트에게 정보를 제공하는 분석서버에 있어서, 상기 클라이언트 사용자가 탭브라우저를 통하여 웹사이트 등에 접속하면, 접속된 사이트의 내용이 탭브라우저에 표시되는 단계, 상기 분석서버는 상기 클라이언트의 탭브라우저에 표시되는 내용에 대한 문맥을 문맥 형태소 분석을 통하여 반복되는 문장, 단어의 빈도수를 식별하는 단계, 상기 식별된 단어 중에서 기준치 이상의 빈도수를 갖는 문장, 단어를 중요단어인 키워드로 선정하는 단계, 상기 선정된 중요단어를 각 탭브라우저의 제목으로 출력하는 단계, 상기 각 탭브라우저의 제목을 포털사이트의 질의어로 사용하여 검색하고, 검색결과를 별도의 각 탭브라우저의 내용으로 출력시키는 단계를 포함하는 것을 특징으로 하는 웹페이지의 형태소 분석을 통한 검색 방법에 관한 것으로 상기 특허는 검색시스템의 일 방법론으로 텍스트 속에 출현하는 문장수, 단어수를 형태소 처리로 계산하여 그것을 키워드로 탭 웹브라우저 제목으로 출력하는 방법이다.
한국특허 등록번호 제10-0691400호 (부가 정보를 이용하여 형태소를 분석하는 방법 및 상기 방법을 수행하는 형태소 분석기)는 형태소 분석방법에 있어서, 검색 색인용 데이터로부터 형태소 분석 대상 및 상기 형태소 분석 대상과 연관된 부가 정보를 획득하는 단계, 상기 부가 정보에 기초하여 키(Key)를 생성하는 단계, 및 상기 키를 활용하여 상기 형태소 분석 대상에 대해 형태소 분석을 수행하는 단계를 포함하는 것을 특징으로 하는 형태소 분석 방법이다.
한국특허 공개번호 제10-2007-0029389호 (핵심 키워드를 이용한 광고서비스 제공방법, 시스템 및 이를 구현하기 위한 프로그램이 기록된 기록매체)는 핵심 키워드를 이용한 키워드 광고 서비스를 제공하기 위해 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있으며 디지털 처리 장치에 의해 판독될 수 있는 기록매체로서, 컨텐츠 텍스트의 형태소를 분석하여 키워드를 추출하는 단계, 광고 키워드 DB 서버와의 인터페이싱을 통해 핵심 키워드를 결정하는 단계, 광고 DB 서버와의 인터페이싱을 통해 상기 핵심 키워드에 매칭되는 광고 리스트를 수신하는 단계 및 상기 광고 리스트에 포함된 광고 중 적어도 하나를 상기 컨텐츠 텍스트에 삽입하는 단계를 수행하는 프로그램이 기록된 기록매체이다.
한국특허 공개번호 제10-2006-0011333호 (메시지 분석을 통한 지역정보 제공 시스템 및 그 방법)은 지역 및 업종 별로 광고 정보를 저장하고 있는 데이터베이스, 저장된 단문 메시지 또는 문자 메시지를 분석하기 위한 메시지 인식수단, 저장된 음성 메시지를 분석하기 위한 음성 인식수단, 가입자 단말기의 현재 위치를 확인하기 위한 위치정보 수집수단, 서비스 가입자와 관련된 메시지가 저장되어 있는지를 상기 메시지 인식수단과 음성 인식수단으로 요청하고, 상기 메시지 인식수단과 음성 인식수단으로부터 전달된 메시지 분석 결과를 확인하여, 선택적으로 상기 위치정보 수집수단으로 가입자 단말기의 현재 위치 정보를 요청하며, 원하는 정보를 가입자 단말기로 전달하기 위해 상기 메시지 분석 결과에 따른 원하는 업종과 지역 정보를 제공하는 서비스 제어수단 및 상기 서비스 제어수단으로부터 전달된 업종과 지역 정보를 이용해 상기 데이터베이스로부터 정보를 검색하여, 검색 결과를 단문 메시지에 포함시켜 가입자 단말기로 전송하는 SMS 생성수단을 포함하는 것을 특징으로 하는 메시지 분석을 통한 지역정보 제공 시스템이다.
한국특허 공개번호 제10-2007-0015752호 (광고 유발 메시징 서비스 시스템 및 그 방법)은 광고 유발 메시징 서비스 시스템에 있어서, 발신단말기로부터 전송된 메시지를 분석하여 광고 유발 식별자를 검출하면, 미리 지정된 광고메시지를 상기 발신단말기로 전송한 후, 상기 메시지의 내용을 수신단말기로 전송하는 메시지서버를 포함하는 것을 특징으로 하는 광고 유발 메시징 서비스 시스템이다.
한국특허 등록번호 제10-0775680호 (이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법 및 그 시스템)은 무선 통신망을 통해 접속된 이동통신 단말기와 서버 사이에서 메신저를 통해 서로 메시지를 주고받는 방법에 있어서, 상기 서버와 접속된 상기 이동통신 단말기가 채팅 대상의 임의의 가상 대화 상대를 선택하는지 판단하는 단계와, 상기 서버에서는 상기 이동통신 단말기의 사용자 선호 정보에 따라 광고 컨텐츠 상품의 채팅 시나리오를 추출하여 상기 시나리오 규칙에 따른 메시지를 상기 이동통신 단말기로 전송하는 단계와, 상기 이동통신 단말기에서 상기 서버의 메시지에 대한 응답 메시지를 전송하는 단계와, 상기 서버에서 수신된 상기 이동통신 단말기의 메시지를 분석하여 사용자 의도와 상기 시나리오 규칙에 따라 광고 컨텐츠 정보 추천 허가를 요청하는 메시지를 상기 이동통신 단말기로 전송하는 단계와, 상기 서버에서는 상기 이동통신 단말기에서 상기 광고 컨텐츠 정보 추천을 허가하는 메시지를 전송할 경우 상기 광고 컨텐츠 정보를 상기 이동통신 단말기로 전송하는 단계를 포함하며, 상기 서버에서 상기 이동통신 단말기에 메시지를 전송하는 단계는 이전에, 상기 서버에서 상기 이동통신 단말기의 메시지를 분석하여 상기 사용자의 의도에 대응되게 상기 메신저의 캐릭터 상태를 조정하는 단계를 더 포함하는 것을 특징으로 하는 이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법이다.
한국특허 등록번호 제10-0597435호 (정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법)은 입력된 질문에 포함된 작품명을 인식하는 질문 작품명 처리부, 질문을 형태소분석, 개체명 인식, 어휘 의미태깅 과정을 통해 개개의 어휘를 의미 있는 코드로 변환하는 질문 언어분석부, 질문의 의미 있는 LSP 형태 코드와 미리 정의된 질문분류 규칙을 이용하여 질문이 요구하는 정답 유형을 분류하는 규칙기반 질문분류부, 질문의 정답유형이 태깅된 학습문서로부터 구축된 통계정보를 이용하여, 질문의 LSP 코드에 대한 분류를 수행하는 통계기반 질문분류부 및 규칙기반 질문분류와 통계기반 질문분류의 결과를 이용하여 최종적으로 사용자의 질문에 대한 정답의 유형을 판별하는 질문 정답유형 결정부를 포함하는 것을 특징으로 하는 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문 분류 시스템방법이다.
한국특허 등록번호 제10-0361166호 (정보 검색 시스템 및 그 방법)은 다수의 정보들이 분야별로 분류되고, 분류된 분야마다 코드가 부여되어 있으며, 각 분야의 코드와 연관하여 해당 분야에 포함되는 다수의 정보를 나타내는 단어들이 코드화 되어 있는 데이터 베이스와 데이터를 검색하고자 하는 이용자가 통신 장치를 이용하여 네트워크를 통해 접속한 후 검색하고자 하는 정보를 나타내거나 해당 정보가 속하는 분야를 나타내는 단어들을 입력하면, 입력된 단어들을 코드화하고 코드화된 단어들을 토대로 하여 상기 데이터 베이스를 검색하여 코드화된 단어들에 해당하는 정보를 찾는 처리 장치를 포함하며, 상기 데이터 베이스에 저장된 정보는 다수의 정보 영역으로 분류되고 상기 정보 영역에는 각각 정보 분류 코드가 할당되고 하나 이상의 세부 정보 영역으로 분류되며, 상기 세부 정보 영역들은 해당 정보 영역의 정보 분류 코드와 연관하여 코드화되며, 상기 정보를 나타내는 단어들 중 서로 동일하거나 비슷한 의미를 가지는 단어들은 동일한 코드로 저장되어 있으며, 각 단어 코드들은 설정된 순서로 배열되어 있는 정보 검색 시스템 방법이다.
한국특허 공개번호 제10-2005-0092955호 (온라인 광고 시스템 및 광고 방법)은 광고될 정보가 저장되어 있는 제1저장장치, 원본 컨텐츠가 저장되어 있는 제2저장장치, 제2저장장치로부터 원본 컨텐츠를 가져와 자연어 처리 기법을 통해 분석하고, 이 분석 결과에 대응하는 광고될 정보를 제1저장장치로부터 가져와 상기 광고 정보 중 일부를 상기 원본 컨텐츠에 삽입하는 적어도 하나의 서버 그리고 상기 적어도 하나의 서버에 의해 상기 광고 정보가 삽입된 컨텐츠가 저장되어 있는 제3 저장장치를 포함하는 것을 특징으로 하는 온라인 광고 시스템 방법이다
한국특허 등록번호 제10-0669534호 (문장추상화와 개연규칙을 활용하는 문서요약 방법과 시스템, 그리고 문장 의미 분석 및 표현방법)은 요약하고자 하는 문서 내용에 대해 입력, 저장하는 문장입력 단계; 상기 단계에서 저장되는 데이터에 대해 구문 분석, 저장하는 구문분석 단계; 상기 단계에서의 구문 데이터들을 순차적으로 읽어 들여 각 문장에서 주요성분들을 추출하고, 이 온톨로지 데이터를 저장하는 문장 주요성분 추출 단계; 상기 단계에서의 온톨로지 데이터 값을, 선별된 주요 구성요소들 각각이 갖는 의미에 대한 소정의 분류기준인 인식상위범주 정보와 비교하여, 선별된 주요 구성요소 각각에 대한 추상적인 의미로 파악되는 데이터 값을 저장하는 문장추상화 단계; 상기 단계에서의 저장 값을 읽어 들여 개연규칙 프로그램 가동장치부로 입력시켜서 구문간 개연성을 갖는 다수 화제문을 선정하고, 선정된 다수 화제문에 대한 식별값들을 각각 저장하는 화제문 선정 단계; 상기 단계에서 저장된, 선별된 주요 구성요소들에 대하여 파악된 추상적인 의미의 해당 값들을 읽어들여 문법적인 요약 문장으로 조합하고, 저장하는 요약문 작성 단계; 출력 제어신호가 있는지를 판단하여 그럴 경우 상기 단계에서 저장된 데이터 값이 출력수단의 가동을 통하여 출력, 표시되게 하는 요약문 출력 단계를 포함하는, 문장추상화와 개연규칙을 활용한 문서 요약 방법에 관한 것이다.
한국특허 등록번호 제10-0836878호 (정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그 방법)은 인터넷을 통해 사용자 단말, 웹 포털 사이트, 웹 사이트와 연결되어 정보를 검색하고 검색된 정보를 제공하는 정보 검색 시스템에서의 주제 또는 분야 할당 장치로서, 상기 정보 검색 서버는, 질의어 또는 문서에 대응하는 색인어를 기반으로 문서에 대하여 정보 검색을 수행하는 검색 엔진과; 상기 검색 엔진에서 검색된 정보를 저장하고 관리하는 데이터베이스와; 상기 데이터베이스에 저장된 원문으로부터 색인어를 추출하여 색인어에 의한 시소러스 매칭을 수행하여 원문에 대한 주제 또는 분야 할당을 수행하는 시소러스 매칭부와; 상기 데이터베이스에 저장된 정의문으로부터 용어를 추출하여 추출한 용어에 의해 주제를 할당하고 택소노미를 사용하여 분야를 할당하는 택소노미 처리부;를 포함하여 구성되는 것을 특징으로 하는 정보 검색 시스템에서의 주제 또는 분야 할당 장치에 관한 것이다.
또한, 현재 구글, 야후 등 대형 정보 검색 포탈이 사용하고 있는 정보 검색 시스템은 "단어" 단위의 검색키방식이 중심이며 비록 '구' 단위 입력을 가능하게 한다 해도 입력되는 '구'의 고도기술에 따른 언어처리 방법이라기보다는 N그램 기반 색인키를 논리연산자(AND, OR, NOT)로 연결하여 검색 결과를 제시하는 정도임으로 현행기술로서는 정보 검색의 재현성, 정확성 향상에는 한계가 있다. 특히 차세대 정보검색분야로서 '모바일정보검색' 기술이 주목을 받고 있고 새로운 웹검색기술이 '시멘틱 웹' 기술이 제안되고 논의 중이나 특별히 성공적인 사례는 없다.
본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 단어 단위를 검색어로 하는 정보 검색 시스템에서 구 단위, 문장 단위로 검색키를 확장하여 정보 검색 시스템의 사용자 인터페이스를 보다 편리하게 할 뿐 아니라 정보의 제공, 검색, 분류, 평가, 모니터링 등의 다기능이 통합 처리 가능한 다기능 통합 정보 검색방법 및 시스템을 제공하는데 있다.
또한, 본 발명은 정보 검색자나 정보 제공자의 의도를 파악하고, 파악된 의도에 기초한 정보 결과를 제공하는 다기능 통합형 정보 검색방법 및 시스템을 제공하는데 있다.
상기 목적을 달성하기 위한 본 발명에 따른, 정보 검색방법은, 검색어에 대한 해석결과를 이용하여, 검색자의 의도를 파악하는 단계; 상기 검색자의 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함한다.
그리고, 본 정보 검색방법은, 입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및 분리된 검색어들을 구문 해석하는 단계;를 더 포함하고, 상기 검색자의 의도 파악단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 검색자의 의도를 파악하는 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것이 바람직하다.
그리고, 상기 구문 표현식은, 논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며, 상기 구문문법 규칙사전은, 구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것이 바람직하다.
그리고, 상기 분리단계는, 상기 검색어를 품사 별로 분리하는 것이 바람직하다.
또한, 상기 분리단계는, 형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 검색어를 품사 별로 분리하는 것이 바람직하다.
그리고, 상기 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 검색자의 의도에 맞는 편집기로 제공하는 것이 바람직하다.
또한, 본 정보 검색방법은, 상기 정보 제공자의 의도를 참조하여 검색을 수행할 디렉토리를 결정하는 단계;를 더 포함하고, 상기 검색 단계는, 결정된 디렉토리와 동일 또는 유사한 디렉토리에서 상기 컨텐츠를 검색하는 것이 바람직하다.
그리고, 상기 검색어는, 단어 단위, 구 단위 및 문장 단위 중 어느 하나인 것이 바람직하다.
또한, 상기 검색단계는, 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동일한 메타데이터 또는 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동의의 메타데이터를 가지는 컨텐츠를 검색하는 것이 바람직하다.
그리고, 본 정보 검색방법은, 상기 검색단계에서의 검색결과에 부가서비스를 부가하는 단계;를 더 포함하는 것이 바람직하다.
또한, 상기 부가서비스는, 컨텐츠 문맥 지각형(Context awareness) 서비스이고, 상기 컨텐츠 문맥 지각형은, 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 경매서비스 및 행정서비스 중 적어도 하나를 포함하는 것이 바람직하다.
그리고, 상기 편집기의 입력 항목들 중 적어도 하나는, 상기 검색어를 이용하여 생성한 리얼데이터로 자동입력되는 것이 바람직하다.
또한, 본 정보 검색방법은, 상기 입력된 메타데이터들 및 검색된 컨텐츠를 구성하는 메타데이터들을 각각 비교하여 일치도가 높은 컨텐츠들을 선별하여 출력하는 단계;를 더 포함하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 정보에 포함된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계; 상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
그리고, 본 검색용 정보 제공방법은, 입력된 정보에 포함된 상기 텍스트를 의미 있는 단어들로 분리하는 단계; 및 분리된 단어들을 구문 해석하는 단계;를 더 포함하고, 상기 정보 제공자의 의도 파악단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것이 바람직하다.
그리고, 상기 구문 표현식은, 논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것이 바람직하다.
또한, 상기 구문 해석단계는, 상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며, 상기 구문문법 규칙사전은, 구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것이 바람직하다.
그리고, 상기 분리단계는, 상기 텍스트를 품사 별로 분리하는 것이 바람직하다.
또한, 상기 분리단계는, 형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 텍스트를 품사 별로 분리하는 것이 바람직하다.
그리고, 본 검색용 정보 제공방법은, 상기 정보 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 정보 제공자의 의도에 맞는 편집기로 제공하는 것이 바람직하다.
또한, 본 검색용 정보 제공방법은, 상기 정보 제공자의 의도를 참조하여 상기 정보가 저장될 디렉토리를 결정하는 단계;를 더 포함하고, 상기 컨텐츠 저장단계는, 결정된 디렉토리에 상기 컨텐츠를 저장하는 것이 바람직하다.
그리고, 본 검색용 정보 제공방법은, 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;를 더 포함하고, 상기 파악 단계는, 수집된 텍스트에 대한 해석결과를 이용하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계; 수집된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계; 상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
한편, 본 발명에 따른, 정보 검색방법은, 검색어를 입력받는 단계; 상기 검색어를 입력한 검색자의 의도를 입력받는 단계; 상기 검색어에 대한 해석결과와 상기 검색자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함한다.
그리고, 본 정보 검색방법은, 입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및 분리된 검색어들을 구문 해석하는 단계;를 더 포함하고, 상기 편집기 제공단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하는 것이 바람직하다.
한편, 본 발명에 따른, 검색용 정보 제공방법은, 정보를 입력받는 단계; 상기 정보를 입력한 정보 제공자의 의도를 입력받는 단계; 상기 정보에 대한 해석결과와 상기 정보 제공자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 정보 제공자에게 제공하는 단계; 및 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함한다.
그리고, 본 검색용 정보 제공방법은, 입력된 정보를 의미 있는 단어들로 분리하는 단계; 및 분리된 단어들을 구문 해석하는 단계;를 더 포함하고, 상기 편집기 제공 단계는, 상기 구문 해석단계에서의 구문 해석결과를 이용하는 것이 바람직하다.
이상 설명한 바와 같이, 본 발명에 따르면, "구", "문장" 수준의 검색이 가능해져, '검색 단어'를 키워드로 하고 그것의 확장으로서 또 다른 검색단어를 논리연산자(AND, OR, NOT)의 조합으로 하여 검색하는 기존의 검색 방식에 비해, 정보의 재현율과 정확도가 훨씬 우수하다.
또한, 본 발명에 따르면, 정보 제공자가 제공하는 정보를 제공자의 의도에 따라 디렉토리 별로 분류하여 저장하고, 정보 검색자의 검색 의도를 파악하여 해당하는 디렉토리에 저장되어 있는 정보에 대해 검색을 수행하는 것이 가능해져, 문맥 지각형 정보 제공/검색을 통한 합의형/맞춤형 검색서비스를 제공할 수 있게 된다.
그리고, 본 발명에 따르면, 컨텐츠 별로 각기 다른 메타데이터를 정의하고, 이 메타데이터를 기반으로 생성되는 편집기를 이용하여, 정보 제공 및 검색 내용을 보다 상세하게 발전시키는 방식을 채택하여, 기존의 검색 방식 보다 간편하고 정교한 검색을 가능하게 한다.
아울러, 본 발명은 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행할 수 있게 된다.
또한, 본 발명에서, 정보 제공자 또는 검색자는 메타데이터를 보다 편리하게 입력할 수 있게 되며, 어떠한 종류의 메타데이터를 입력하여야 하는지에 대한 가이드도 제공받을 수 있게 되는바, 입력의 편의성을 증대시킬 수 있게 된다.
그리고, 정보 제공자의 의도를 기초로 해당하는 정보를 디렉토리 별로 구분하되, 이에 해당하는 메타데이터들을 매칭시켜 저장할 수 있게 된다.
한편, 본 발명에 따르면 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하되 리얼 데이터 생성이 가능한 메타 데이터는 자동으로 입력가능해 진다.
또한, 본 발명에 따르면, 정보 제공자와 정보 검색자가 의도를 직접 입력하도록 할 수 있어, 정보 제공자와 정보 검색자의 의도를 보다 정확하게 파악할 수 있게 되어, 궁극적으로는 정확한 정보 제공과 검색을 가능하게 한다.
그리고, 입후보자에 대한 홍보물을 PC, 휴대폰 등을 이용하여 유권자에게 배포할 수 있게 되어, 현재 이용중인 종이포스터에 의한 입후보자 홍보물을 값싸고, 신속하게 제공할 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 검색시스템을 도시한 도면,
도 2는 컨텐츠들에 대한 메타데이터를 예시한 도면,
도 3은 한국어 형태소 사전을 도시한 도면,
도 4는 구/문장을 형태소 처리한 후 구문해석을 수행하는 과정의 부연설명에 제공되는 도면,
도 5는 본 발명의 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 6은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 7은 부가서비스 데이터베이스에 저장되어 있으며 부가서비스 생성기에 의해 생성되는 부가서비스의 일 예로 문맥지각형 검색서비스의 일종인 지리안내 서비스의 설명에 제공되는 도면,
도 8는 도 7과 다른 종류의 부가 서비스를 제공하는 방법의 설명에 제공되는 도면,
도 9는 정보검색창과 정보제공창이 함께 구비된 정보 제공/검색창의 일 예를 도시한 도면,
도 10는 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면,
도 11 및 도 12는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면,
도 13은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면,
도 14 내지 도 16은 도 13에 도시된 검색방법의 부연설명에 제공되는 도면,
도 17은 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면,
도 18은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도,
도 19는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면, 그리고,
도 20은 전자투표용 입후보자의 홍보 제공용에 적용한 예를 도시한 도면이다.
* 도면의 주요 부분에 대한 부호의 설명 *
101 : 정보검색창 102 : 검색어 입력기
103 : 검색어 형태소 처리기 104 : 검색어 구문 해석기
105 : 검색자 의도 파악기 106 : 정보 모니터
107 : 검색용 메타데이터 추출기 108 : 검색용 편집기
*109 : 검색 디렉토리 결정기 110 : 검색기
111 : 메타데이터 비교기 112 : 부가서비스 데이터베이스
113 : 부가서비스 생성기 114 : 검색 결과 생성기
115 : 정보 저장기 116 : 저장 디렉토리 결정기
117 : 정보 제공용 편집기 118 : 정보 제공용 메타데이터 추출기
119 : 메타데이터 DB 120 : 정보 제공자 의도 파악기
121 : 정보 모니터 122 : 정보 구문 해석기
123 : 구문문법 규칙사전 124 : 정보 형태소 처리기
125 : 형태소 사전 126 : 정보 입력기
127 : 정보 제공창 128 : 정보 DB
129 : 검색결과 표시기 1001 : 정보검색창
1002 : 검색어 입력기 1003 : 검색어 형태소 처리기
1004 : 검색어 구문 해석기 1005 : 검색자 의도 파악기
1006 : 정보 모니터 1007 : 검색용 메타데이터 추출기
1008 : 검색용 편집기 1009 : 검색기
1010 : 메타데이터 비교기 1011 : 부가서비스 데이터베이스
1012 : 부가서비스 생성기 1013 : 검색결과 생성기
1014 : 정보 저장기 1015 : 정보 제공용 편집기
1016 : 정보 제공용 메타데이터 추출기
1017 : 메타데이터 DB 1018 : 컨텐츠 제공자 의도 파악기
1019 : 정보 모니터 1020 : 구문 해석기
1021 : 구문문법 규칙사전 1022 : 형태소 처리기
1023 : 형태소 사전 1024 : 디렉토리 컨텐츠 크롤러
1025 : 정보 DB 1026 : 검색결과 표시기
1027 : 검색 디렉토리 결정기 1028 : 저장 디렉토리 결정기
1701 : 정보 제공/검색창 1702 : 형태소 처리기
1703 : 형태소 사전 1704 : 구문 해석기
1705 : 구문문법 규칙사전 1706 : 의도 지정기
1707 : 정보 모니터 1708 : 정보 제공용 메타데이터 추출기
1709 : 정보 제공용 편집기 1710 : 저장 디렉토리 결정기
1711 : 정보 저장기 1712 : 정보 DB
1713 : 메타데이터 DB 1714 : 검색용 메타데이터 추출기
1715 : 검색용 편집기 1716 : 검색 디렉토리 결정기
1717 : 검색기 1718 : 메타데이터 비교기
1719 : 검색 결과 생성기 1720 : 검색결과 표시기
1721 : 부가서비스 데이터베이스 1722 : 부가서비스 생성기
이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 정보 제공자가 제공하는 정보를 제공자의 의도에 따라 디렉토리 별로 분류하여 저장하고, 정보 검색자의 검색 의도를 파악하여 해당하는 디렉토리에 저장되어 있는 정보에 대해 검색을 수행하는 문맥 지각형(Context awareness) 정보 제공/검색을 통해, 합의형/맞춤형 검색서비스를 제공하는 것이다.
또한, 본 실시예에서는 컨텐츠 별로 각기 다른 메타데이터(metadata)를 정의하고, 이 메타데이터를 기반으로 생성되는 편집기를 이용하여, 정보 제공 및 검색 내용을 보다 상세하게 발전시키는 방식을 채택하여, 기존의 검색 방식 보다 간편하고 정교한 검색을 가능하게 한다.
여기서, 메타데이터란 정보 제공/검색의 대상이 되는 컨텐츠의 특징을 보다 상세하고 체계적으로 정의할 수 있는 데이터이다. 예를 들어, '책'에 대한 메타데이터는 책이름, 저자, 출판사, 출판년도, 가격 및 주제 등과 같은, 책에 대한 세부정보가 이에 해당한다.
본 실시예에서, 메타데이터는 정해진 프레임(Frame)을 가지는 편집기를 통해 입력하고 확인하는 것이 가능하게 한다. 프레임의 형식은 테이블 형식 또는 문장 형식으로 구현할 수 있다.
도 2는 컨텐츠들에 대한 메타데이터를 예시한 도면이다. 도 2에 도시된 바에 따르면, 모든 영역의 컨텐츠들에 대해 필수적인 메타데이터가 정의되어 있는 것을 확인할 수 있다.
예를 들어, 부동산매매(202)는 메타데이터로, "매물", "소재지", "희망가", "특징", "지하철 정보" 및 "영상정보" 등이 표준화되어 있음을 확인할 수 있다.
도 2에 도시된 컨텐츠들에 대한 메타데이터는 도 1에 도시된 메타데이터 DB(119)에 저장되어 있다.
한편, 본 실시예에 따른 검색시스템은, 도 1에 도시된 바와 같이, 정보검색창(101), 검색어 입력기(102), 검색어 형태소 처리기(103), 검색어 구문 해석기(104), 검색자 의도 파악기(105), 정보 모니터(106), 검색용 메타데이터 추출기(107), 검색용 편집기(108), 검색 디렉토리 결정기(109), 검색기(110), 메타데이터 비교기(111), 부가서비스 데이터베이스(112), 부가서비스 생성기(113), 검색 결과 생성기(114), 정보 저장기(115), 저장 디렉토리 결정기(116), 정보 제공용 편집기(117), 정보 제공용 메타데이터 추출기(118), 메타데이터 DB(119), 정보 제공자 의도 파악기(120), 정보 모니터(121), 정보 구문 해석기(122), 구문문법 규칙사전(123), 정보 형태소 처리기(124), 형태소 사전(125), 정보 입력기(126), 정보 제공창(127), 정보 DB(128) 및 검색결과 표시기(129)를 포함한다.
정보 입력기(126)는 정보 제공창(127)을 통해 사용자가 입력한 정보를 정보 형태소 처리기(124)로 전달한다.
형태소 사전(125)에는 각 단어의 품사 정보가 데이터 베이스화 되어 있다. 뿐만 아니라, 형태소 사전(125)에는 각 단어의 의미 정보, 동의어 정보, 대역 외국어 등의 확장 정보도 데이터 베이스화 되어 있다. 여기서, 형태소 사전(125)에 등록되는 단어에 대한 제한은 없으므로, 형태소 사전(125)에는 명사 이외의 다른 품사(대명사, 형용사, 조사, 어미 등)도 등록될 수 있음은 물론이다.
형태소 사전(125)에 수록되어 있는 품사 정보는 텍스트를 품사 별로 분리하는데 참조되고, 의미 정보는 컨텐츠 작성자 또는 검색자의 의도를 파악하는데 이용된다. 또한, 동의어 정보는 보다 넓은 범위의 확장 검색을 수행하는데 이용되고, 대역 외국어는 다국어 검색을 수행하는데 이용된다.
도 3에는 형태소 사전(125)에 수록되어 있는 정보가 예시되어 있으므로, 형태소 사전(125)에 대해서는 후에 도 3을 참조하여 상세히 설명하기로 한다.
정보 형태소 처리기(124)는 정보 입력기(126)로부터 전달받은 텍스트를 '의미 있는 단어' 단위로 분리한다. 여기서, '의미 있는 단어'란 품사를 말하는데, 이에 따르면 정보 형태소 처리기(124)는 텍스트를 품사 별로 분리하는 것으로 이해할 수 있다.
이를 위해, 정보 형태소 처리기(124)는 형태소 사전(125)에 데이터 베이스화되어 있는 단어에 대한 품사 정보를 참조하여, 텍스트를 품사별로 분리하게 된다.
정보 구문 해석기(122)는 정보 형태소 처리기(124)의 형태소 처리 결과를 토대로, 사용자가 입력한 정보에 대해 구문 해석을 수행한다. 정보 구문 해석기(122)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(123)에 수록되어 있는 문법 규칙을 참조한다.
정보 제공자 의도 파악기(120)는 정보 구문 해석기(122)에서 출력되는 구문 해석 결과를 이용하여, 정보 제공자의 의도를 파악한다.
정보 모니터(121)는 정보 제공자 의도 파악기(120)에 의해 파악된 정보 제공자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(121)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(118)는 정보 제공자 의도 파악기(120)가 파악한 정보 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다.
정보 제공용 편집기(117)는 정보 제공용 메타데이터 추출기(118)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(116)는 컨텐츠가 저장되기에 적합한 정보 DB(128) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(116)는 정보 제공자 의도 파악기(120)가 파악한 정보 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(115)는 정보 제공용 편집기(117)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(128)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(116)에 의해 결정된 디렉토리에 저장된다.
지금까지 설명한 구성들은 정보제공을 위해 필요한 정보를 생성하여 저장하는데 이용되는 구성들이다. 이하에서는, 정보 검색자가 검색어를 입력하여 검색을 요청한 경우, 검색 의도를 파악하여 보다 상세한 검색어 입력을 유도하여 보다 정확한 검색이 가능하도록 하는 구성들에 대해 상세히 설명한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
정보검색창(101)은 사용자가 검색어를 단어, 구 또는 문장으로 입력할 수 있는 입력창을 제공한다. 그리고, 검색어 입력기(102)는 정보검색창(101)을 통해 사용자가 입력한 검색어를 검색어 형태소 처리기(103)로 전달한다.
검색어 형태소 처리기(103)는 검색어 입력기(102)로부터 전달받은 검색어를 '의미 있는 단어' 단위로 분리한다. 여기서, '의미 있는 단어'란 품사를 말하는데, 이에 따르면 검색어 형태소 처리기(103)는 정보 형태소 처리기(124)와 동일한 방법으로 검색어를 품사 별로 분리하는 것으로 이해할 수 있다.
이를 위해, 검색어 형태소 처리기(103)는 형태소 사전(125)에 데이터 베이스화되어 있는 단어에 대한 품사 정보를 참조하여, 텍스트를 품사별로 분리하게 된다.
검색어 구문 해석기(104)는 검색어 형태소 처리기(103)의 형태소 처리 결과를 토대로, 검색자가 입력한 검색어에 대해 구문 해석을 수행한다. 검색어 구문 해석기(104)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(123)을 참조한다.
검색자 의도 파악기(105)는 검색어 구문 해석기(104)에서 출력되는 구문 해석 결과를 이용하여, 검색자의 의도를 파악한다.
정보 모니터(106)는 검색자 의도 파악기(105)에 의해 파악된 검색자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(106)는 그래픽 툴을 이용할 수 있다.
검색용 메타데이터 추출기(107)는 검색자 의도 파악기(105)가 파악한 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다.
검색용 편집기(108)는 검색용 메타데이터 추출기(107)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(109)는 컨텐츠를 검색하기에 적합한 정보 DB(128) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(109)는 검색자 의도 파악기(105)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정할 수 있다. 그리고, 검색 디렉토리 결정기(109)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(128)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(109)에서 결정된 디렉토리에서 수행된다.
검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(110)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색하는 것도 가능하다. 즉, 검색기(110)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
메타데이터 비교기(111)는 검색용 편집기(108)를 통해 입력된 메타데이터들과 검색기(110)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(112)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(113)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(113)는 부가서비스 데이터베이스(112)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(112)와 부가서비스 생성기(113)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 행정서비스 등이 포함된다.
검색 결과 생성기(114)는 메타데이터 비교기(111)에서 출력되는 검색결과(컨텐츠들)와 일치정도에 부가서비스 생성기(113)에서 생성된 부가서비스를 부가한다.
검색결과 표시기(129)는 검색 결과 생성기(114)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(113)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(114)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
이하에서는, 전술한 형태소 사전(125)에 대해, 도 3을 참조하여 상세히 설명한다. 도 3에는 형태소 사전의 일 예로, 한국어 형태소 사전을 도시하였다.
도 3에 도시된 바와 같이, 형태소 사전(125)은, 1) 제1열에는 단어가, 2) 제2열에는 단어의 품사정보가, 3) 제3열에는 단어의 의미 정보가, 4) 제4열에는 동의어(또는 동의구), 유사어 및/또는 대표어의 집합이, 5) 제5열에는 대역 영어가, 6) 제6열에는 대역 일본어가, 7) 제7열에는 대역 중국어가, 각각 나열되어 구성된다.
도시된 형태소 사전(125)은, 정보 형태소 처리기(124)가 텍스트를 형태소 처리하는데 이용되고, 검색어 형태소 처리기(103)가 검색어를 형태소 처리하는데 이용된다.
전술한 바 있듯이, 형태소 처리는 주어진 문장의 요소가 어떤 의미 있는 단어로 구성되어 있는가를 가리는 것이다. 예를 들어, "학교에 간다"를 형태소 처리하면 "학교+에+가+ㄴ다"와 같이 단어 경계를 나누는 것이, 형태소 처리이다.
이때, 사용하는 정보는 형태소 사전(125)에 저장되어 있는 품사 정보로 각 품사간의 인접가능 관계를 조사하여 처리 결과로써, "학교/명사+에/조사+가/동사+ㄴ다/어미"와 같이 출력한다.
이와 동시에 형태소 처리의 부차적 정보로써 "단어빈도", "문장수" 등 언어통계치를 구할 수 있고 의미 정보, 동의어 정보, 대역 외국어를 동시에 출력하는 것이 가능하다.
한편, 형태소 사전(125)에 수록되어 있는 의미 정보는,
1) 명사의 경우, 물건|자연|재료|요소|도구|수단|인간관계|사회|범죄|조직|문화|동물|인간|식물|수|추상|구성|구체|행위|상태|때|장소|위치|간격|회수|비율|정도|수량|강조|진위|감정|욕설|비하|정치|경제|회사명|지역명|사건|인명|음식|음란|의약품 등으로 분류되고,
2) 동사의 경우, 행위|순간|계속|이동|변화|감정|사고|지각|존재|판단|무의지|표현|서비스 등으로 분류되며,
3) 형용사의 경우, 상태|관계|성질|정도|강조|호감|비호감|선정|음란|양태 등으로 분류되고,
4) 조사의 경우, 구|수단/방법|원료/재로|원인/이유|원천/기점|착점/방향|목적/목표|결과|주는쪽|받는쪽|장소|때|경우|내용|역할|대조|범위/회수|정도|수량|비율|강조|진위|양태 등으로 분류하며,
5) 부사의 경우, |강조|등으로 분류되고,
6) 양태를 나타내는 어미의 경우, 과거|현재|미래|부정|가능|자별|의무|필요|불가피|요청|요구|단정|확실한추정|불확실추정|예정|희망|시행|명령|의문|의리|허가|권유|사역|의뢰|수동|수익|겸손|존칭 등으로 분류된다.
하지만, 위에서 제시한 분류는 일 예에 불과하며 고정적인 것도 아니다. 단어의 의미는 시시각각 변화한다는 점에서, 의미 분류도 고정된 것이 아닌 시대의 변천에 따라 변화될 수 있음은 물론이다. 또한, 의미 정보 분류시에는 시소러스 분류에 의한 어휘 사전을 참조할 수 있음은 물론이다.
도 3에 예시된 바에 따르면,
1) "이승만(125-1)"은, 품사 정보가 "명사", 의미 정보는 "인명", 동의어 정보는 "한국 대통령"임을 알 수 있고,
2) "냉면(125-2)"은, 품사 정보가 "명사", 의미 정보는 "음식명", 동의어 정보는 "한국 대표적 면류 음식"임을 알 수 있으며,
3) "이산화탄소(125-3)"는, 품사 정보가 "명사", 의미 정보가 "유해물질", 동의어 정보가 "시오투, 지구 온난화"임을 알 수 있고,
4) "세요(125-4)"는, 품사 정보가 "어미", 의미 정보가 "요청,존대", 동의어 정보가 "명령"임을 알 수 있으며,
5) "놈(125-5)"은 품사 정보가 "명사", 의미 정보가 "비하", 동의어 정보가 "넘"임을 알 수 있다.
의미 정보와 동의어 정보는, 검색을 확대, 확장시키는데 이용될 수 있다. 예를 들어, "이승만"을 검색어로 한 경우, "이승만"에 대한 검색결과는 물론, "한국 대통령"에 관련하는 검색 결과도 더 제공하는 것이 가능하도록 한다.
또한, "이산화탄소 대책"을 검색어로 한 경우, "이산화탄소 대책"에 대한 검색결과는 물론, "유해 물질", "CO2 대책", "지구 온난화 대책"에 관련하는 검색결과도 더 제공하는 것이 가능하다.
마찬가지로, "소고기, 돼지고기, 김치" 등의 의미 정보는 "식품"이고, 동의어 정보는 "육류", "채소류"이므로, 의미 정보와 동의어 정보를 이용하여 확장 검색을 수행하는 것이 가능하다.
이와 같이, 형태소 사전(125)에는 품사 정보 외에도 의미 정보와 동의어 정보가 수록되어 있으므로, 풍부한 정보 검색을 가능하게 한다.
이하에서는, 구/문장을 형태소 처리하여 구문 해석하는 과정에 대해 도 3을 참조하여 부연설명한다.
구문해석이란, 문장을 구성하는 각각의 의미 있는 단어가 바른 문으로서 어떤 구조를 가지고 있는지를 해석하는 과정이다. 구문해석에는 자연언어를 기술하는 문법이론이 이용된다. 자연언어를 기술하는 문법이론에는 구구조문법, 격문법, 의존문법, 어휘문법 등이 있는데, 이들은 문법기술 방법에 차이점이 있다.
영어, 한국어, 중국어, 일본어 등 모든 언어에 상기 문법이론은 적용 가능하므로, 본 실시예에서 제시하는 한국어 구문 해석 방법론은 다른 언어들에도 적용할 수 있다.
도 4에 도시된 형태소 처리(401) 과정을 끝낸 입력문은 의미 있는 단어 단위로 분리되며 분리된 단어들에는 각각 품사 정보가 부가(402)되어 있다. 품사 정보는 {명사, 대명사, 수사, 형용사, 부사, 조사…} 등 10~12개 정도의 품사명으로 되어 있다.
각각의 단어들이 서로 어떻게 결합되어 바른 구, 절, 문을 이루는가를 해석하기 위해서는 각 언어에서의 바른 구, 절, 문에 대한 생성규칙(403)이 필요한데, 이 규칙은 전술한 구문문법 규칙사전(123)에 포함되어 있으므로, 구문문법 규칙사전(123)으로부터 추출한다.
예를 들면, "문장은 주부(명사구)와 술부(동사구)로 이루어진다" 라는 지식을 문법 규칙화하면 S(Sentence)←NP(Noun Phrase)·VP(Verb Phrase)로 표현된다. 이러한 규칙이 정의된 곳이 구, 절, 문에 대한 생성규칙(403)인 것이다.
이들 규칙을 간단히 설명하면, 1) 구구조문법 형식은 단어 단위에서 구, 절, 문 단위로 생성하는 규칙을 기반으로 정의되고, 2) 격문법 형식과 의존문법형식은 어절이라는 단위들의 수식과 피수식 관계를 규칙으로 정의되며, 3) 어휘문법형식은 VP=cat(동사, 종지, … Sub, SEM) 형식을 취하며 각 단어간의 바른 결합을 단일화(Unification)라는 연산으로 수행된다.
구체적인 예를 들면, 구구조문법 규칙과 처리방법은
(1) S ← PPV
(2) PP ← NP
과 같이 정의해 두고 "서울에서 왔다"를 구문 해석하면 형태소 처리 결과 (서울/N(명사), 에서/P(조사), 왔다/V(동사)과거)의 단어들이 생성되며, 구문 해석이 수행되면, "서울에서"는 "NP"이므로 "서울에서"는 문법규칙(2)에 따라 "PP(전치사구)"로 구문 해석되며 "왔다"는 'V(동사)'이므로 PP와 V는 문법규칙(1)에 따라 'S(문장)'으로 해석되어 그 결과를 한국어의 경우 ((서울에서)왔다)라는 목(tree)구조 또는 리스트(list)구조식으로 출력된다.
한편, 상기의 예문을 의존문법규칙으로 해석하면 어절, "서울에서"가 어절 "왔다"를 수식하는 구문 해석 관계를 "서울에서→왔다"라는 표현식으로 출력된다.
그리고, 어휘문법형식은 (왔다, [누가], [서울에서])라는 구문해석 결과를 의미표현식으로 출력한다. 본 발명에서는 문법 이론에 따라 각각의 구문해석 표현식을 출력(404)할 수 있다. 이에 따라, 품사정보에 의한 표현식(405), 의미정보에 의한 표현식(406), 동의어/구에 의한 표현식(407)이 출력가능하다.
도 5은 본 발명의 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도이다.
도 5에 도시된 바와 같이, 정보 제공창(127)을 통해 사용자가 "중고차 팝니다"를 입력하면, 정보 입력기(126)는 사용자가 입력한 정보를 정보 형태소 처리기(124)로 전달한다(501).
그러면, 정보 형태소 처리기(124)는 형태소 사전(125)를 참조하여, "중고차 팝니다"를 품사 별로 분리하여 "중고차/파/ㅂ니다"로 출력한다(502).
이때, 형태소 처리 결과로 품사 정보와 의미 정보(명사/중고차, 동사/판매, 어미/존대)가 함께 출력된다. 여기서, 품사 정보는 명사, 동사, 어미이고, 의미 정보는 중고차, 판매, 존대이다.
이후, 정보 구문 해석기(122)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (중고차→판매)를 출력한다(503).
정보 제공자 의도 파악기(120)는 정보 구문 해석기(122)에서 출력되는 구문 해석 결과를 이용하여, 정보 제공자의 의도를 '중고차 판매'로 파악한다(504).
그러면, 정보 제공용 메타데이터 추출기(118)는 정보 제공자의 의도인 '중고차 판매'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출한다(505).
정보 제공용 편집기(117)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다(506). 그러면, 정보제공자는 제공된 편집기를 통해 메타데이터들을 입력한다(507).
도 5에서는 세부 항목들에 대해, "중고차량 명: 소나타", "변속기: 오토", "년식: 2001년", "주행거리: 10만 킬로", "색깔: 은색", "희망가격: 120만원"와 사진 정보를 함께 입력한 경우를 예시하였다.
그러면, 저장 디렉토리 결정기(116)는 컨텐츠가 저장되기에 적합한 정보 DB(128) 상의 디렉토리를 결정하여, 디렉토리 색인키(중고차, 판매)을 부가한다. 이는, 컨텐츠가 해당 디렉토리에 저장되도록 하기 위함이다. 한편, 저장 디렉토리 결정기(116)는 디렉토리 색인키(중고차, 판매) 외에 사용자 ID를 부가할 수 있다(508).
그리고, 정보 저장기(115)는 정보 제공용 편집기(117)에 의해 입력된 메타데이터들을 통합한 컨텐츠를 정보 DB(128)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(116)에 의해 결정된 디렉토리에 저장된다.
지금까지, 정보 제공자가 입력한 정보로부터 사용자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하여 하나의 컨텐츠로 저장하는 과정에 대해 상세히 설명하였다.
이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검색자가 입력한 검색어를 기초로 검색을 수행하는 과정에 대해, 도 6을 참조하여 상세히 설명한다.
도 6은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어를 입력하면, 검색자의 검색 의도를 파악하고, 파악된 검색자의 의도를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 6에 도시된 바와 같이, 먼저 정보검색창(101)을 통해 사용자가 검색어 "중고차 삽니다"를 입력하면(601), 검색어 형태소 처리기(103)는 입력된 검색어를 품사 별로 분리하여 (중고차/사/ㅂ니다)로 출력함과 동시에 (명사/중고차, 사/구매, 어미/존대)의 품사정보와 의미정보를 부가하여 출력한다(602).
그러면, 검색어 구문 해석기(104)는 형태소 처리 결과를 토대로 구문 해석을 수행하여, 그 결과로 (중고차→구매)를 출력한다(603).
검색자 의도 파악기(105)는 구문 해석 결과를 이용하여, 검색자의 의도를 '중고차→구매'로 파악한다(604).
그러면, 검색용 메타데이터 추출기(107)는 검색자의 의도인 '중고차 구매'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(119)로부터 추출하고, 검색용 편집기(108)는 검색용 메타데이터 추출기(107)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(605).
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(606). 도 6에서는 세부 항목들에 대해, "중고차량 명: 소나타", "변속기: 오토", "년식: 2001년 이후", "주행거리: 10만 km 미만", "색깔: 은색", "희망가격: 120만원 이하" 및 "연료: LPG"를 입력한 경우를 예시하였다.
검색 디렉토리 결정기(109)는 컨텐츠를 검색하기에 적합한 정보 DB(128) 상의 디렉토리를 결정하고, 검색기(110)는 검색용 편집기(108)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(128)에서 검색한다(607). 검색은 검색 디렉토리 결정기(109)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(109)는 검색자 의도 파악기(105)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(110)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(111)는 검색용 편집기(108)를 통해 입력된 메타데이터들과 검색기(110)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(608). 그리고, 메타데이터 비교기(111)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(609).
지금까지, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
본 실시예에서는 정형화 또는 표준화된 편집기를 이용하여 메타데이터를 입력하도록 구현하였다. 이에 따라, 정보 제공자 또는 검색자는 메타데이터를 보다 편리하게 입력할 수 있게 되며, 어떠한 종류의 메타데이터를 입력하여야 하는지에 대한 가이드도 제공받을 수 있게 되는바, 입력의 편의성을 증대시킬 수 있게 된다.
*이와 같은 정형화된 편집기를 이용한 메타데이터 입력방식은 휴대폰 또는 IPTV와 같은 기기의 경우에도 적용할 수 있다.
한편, 본 실시예에서는 조건 검색도 가능하도록 하였는데, 이는 특정 메타데이터를 특정한 조건으로 한정하는 것이다. 예를 들면, "120만원이하 중고차"라는 검색어로 검색을 수행하는 것이 조건 검색에 해당한다.
도 7은 부가서비스 DB(112)에 저장되어 있으며 부가서비스 생성기(113)에 의해 생성되는 부가서비스의 일 예로 문맥지각형 검색서비스의 일종인 지리안내 서비스의 설명에 제공되는 도면이다.
이를 위해, 도 7에서는 정보검색창(101)을 통해 "이근처 맛있는 이태리 레스토랑은"(701)이라는 문장이 입력된 것을 가정하였다.
입력된 문장(701)은 검색어 형태소 처리기(103)에 의해 형태소 처리되어, "이근처/맛있/는/이태리/레스토랑/은"으로 분리된 후(702), 의미 정보들이 부가된 "이근처/명사/현재위치, 맛있/형용사/음식평가, 는/조사/수식, 이태리/명사/국명, 레스토랑/명사/음식점, 은/조사/제시"(703)가 출력된다.
그러면, 검색어 구문 해석기(104)는 형태소 처리 결과를 구문해석하고, 검색자 의도 파악기(105)는 구문해석 결과를 통해, 검색자의 의도를 파악한다. 구체적으로, 검색자 의도 파악기(105)는 문맥지각형 단어 '은/는'의 의미 정보가 '제시'를 나타내므로 '검색요청'을 의미하는 것으로 파악하고, 문맥지각형 단어 "이근처"는 'GPS에 의해 확인가능한 현재 위치'를 획득하여야 하는 의미로 파악하고, '이태리 레스토랑'은 음식점 데이터베이스의 검색을 각각 요구한다는 의도로 파악한다.
이에 따라, 부가서비스 생성기(113)는 GPS를 이용하여 현재위치 파악하고(704), 검색기(110)는 맛있는 이태리 레스토랑에 대한 검색을 수행하고(705), 부가서비스 생성기(113)는 지도를 실행하여(706), 현재 위치가 나타난 지도에 검색된 맛있는 이태리 레스토랑이 표시된 지도를 출력한다(707).
도 8에는 다른 종류의 부가 서비스를 제공하는 방법의 설명에 제공되는 도면이다. 도시된 부가 서비스는, 검색결과로 출력되는 텍스트에 포함되어 있는 특정 단어, 주제와 관련하여 다양한 부가 정보를 제공하는 것이다. 이를 위해서는, 부가서비스 데이터베이스(112)에 저장되어 있는 기관정보(801), 광고(802), 인물정보(803), 토픽주제정보(804), 회사정보(805) 등의 각종 정보를 활용할 수 있음은 물론, 네트워크를 통해 연결된 다른 데이터 베이스로부터 획득할 수 있음은 물론이다.
도 9는 정보검색창과 정보제공창이 함께 구비된 정보 제공/검색창의 일 예를 도시한 도면이다. 도시된 정보 제공/검색창에서 입력창(901)은 검색어를 입력하는데 이용되는 창이고, 정보제공 버튼(902)은 입력창(901)에 입력된 정보를 제공/등록하고자 할 때 이용되는 버튼이며, 정보검색 버튼(903)은 입력창(901)에 입력된 검색어에 대한 정보검색을 명령하는데 이용되는 버튼이다.
그리고, 하부에 마련된 버튼들(904)은 검색 방법과 검색 결과 제공방법을 설정하는데 이용되는 버튼이다. 예를 들어, 도 9에 제시된 "완전검색" 버튼은 검색방식을 완전 검색으로 설정하는데 이용되는 버튼이고, "광고허용" 버튼은 검색결과와 관련된 광고물을 검색결과와 함께 표시할 것을 허용하는데 이용되는 버튼이고, "관련서비스 제공허용" 버튼은 검색결과에 포함되어 있는 단어, 문구들에 대한 부가정보를 함께 제공할 것을 허용하는데 이용되는 버튼이다.
도 7 내지 도 9에 제시된 구현 예들은, 이하에서 설명할 다른 실시예들에도 적용되므로, 이하에서 설명할 실시예들에서는 이 구현 예들에 대해 반복하여 설명하지 않을 것이다.
도 10는 본 발명의 또 다른 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 도 10에 도시된 바와 같이, 정보검색창(1001), 검색어 입력기(1002), 검색어 형태소 처리기(1003), 검색어 구문 해석기(1004), 검색자 의도 파악기(1005), 정보 모니터(1006), 검색용 메타데이터 추출기(1007), 검색용 편집기(1008), 검색기(1009), 메타데이터 비교기(1010), 부가서비스 데이터베이스(1011), 부가서비스 생성기(1012), 검색결과 생성기(1013), 정보 저장기(1014), 정보 제공용 편집기(1015), 정보 제공용 메타데이터 추출기(1016), 메타데이터 DB(1017), 컨텐츠 제공자 의도 파악기(1018), 정보 모니터(1019), 구문 해석기(1020), 구문문법 규칙사전(1021), 형태소 처리기(1022), 형태소 사전(1023), 디렉토리 컨텐츠 크롤러(1024), 정보 DB(1025), 검색결과 표시기(1026), 검색 디렉토리 결정기(1027) 및 저장 디렉토리 결정기(1028)를 구비한다.
디렉토리 컨텐츠 크롤러(1024)는 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집한다. 디렉토리 컨텐츠 크롤러(1024)에 의해 수집된 텍스트는 후술할 형태소 처리기(1022)로 전달된다.
도 10에는 컨텐츠가 저장되어 있는 디렉토리로, 구인정보(21), 대학입시정보(13), 부동산(23), 금융(24), 자동차(25), 영화연극(26), 쇼핑(27), 교통 정보(28), 여행 정보(29), 추천(30) 등을 상정하였으나, 이외의 다른 디렉토리가 적용될 수 있음은 물론이다.
형태소 사전(1023)은 도 1에 도시된 형태소 사전(125)과 동일한 것으로 구현할 수 있다. 형태소 처리기(1022)는 형태소 사전(1023)를 참조하여, 디렉토리 컨텐츠 크롤러(1024)로부터 전달되는 텍스트를 품사 별로 분리하여 출력한다.
구문 해석기(1020)는 형태소 처리기(84)의 형태소 처리 결과를 토대로, 컨텐츠에 포함된 텍스트에 대해 구문 해석을 수행한다. 구문 해석을 수행함에 있어, 구문 해석기(1020)는 구문문법 규칙사전(1021)을 참조한다.
컨텐츠 제공자 의도 파악기(1018)는 구문 해석기(1020)에서 출력되는 구문 해석 결과를 이용하여, 컨텐츠 작성자의 의도를 파악한다.
정보 모니터(1019)는 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 컨텐츠 작성자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1019)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(1016)는 컨텐츠 제공자 의도 파악기(1018)가 파악한 컨텐츠 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
정보 제공용 편집기(1015)는 정보 제공용 메타데이터 추출기(1016)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(1028)는 컨텐츠가 저장되기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1028)는 컨텐츠 제공자 의도 파악기(1020)가 파악한 컨텐츠 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1014)는 정보 제공용 편집기(1015)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1025)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1028)에 의해 결정된 디렉토리에 저장된다.
지금까지 설명한 구성들은 컨텐츠를 수집하고 수집된 컨텐츠를 작성자의 의도를 기초로 구분하여 저장하는데 이용되는 구성들이다. 이하에서는, 정보 검색자가 검색어를 입력하여 검색을 요청한 경우, 검색 의도를 파악하여 보다 상세한 검색어 입력을 유도하여 보다 정확한 검색이 가능하도록 하는 구성들에 대해 상세히 설명한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
정보검색창(1001)은 사용자가 검색어를 단어, 구 또는 문장으로 입력할 수 있는 입력창을 제공한다. 그리고, 검색어 입력기(1002)는 정보검색창(1001)을 통해 사용자가 입력한 검색어를 검색어 형태소 처리기(1003)로 전달한다.
검색어 형태소 처리기(1003)는 형태소 사전(1023)를 참조하여, 검색어 입력기(1002)로부터 전달받은 검색어를 품사 별로 분리하여 출력한다.
검색어 구문 해석기(1004)는 검색어 형태소 처리기(1003)의 형태소 처리 결과를 토대로, 검색자가 입력한 검색어에 대해 구문 해석을 수행한다. 검색어 구문 해석기(1004)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(1021)을 참조한다.
검색자 의도 파악기(1005)는 검색어 구문 해석기(1004)에서 출력되는 구문 해석 결과를 이용하여, 검색자의 의도를 파악한다.
정보 모니터(1006)는 검색자 의도 파악기(1005)에 의해 파악된 검색자의 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1006)는 그래픽 툴을 이용할 수 있다.
검색용 메타데이터 추출기(1007)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
검색용 편집기(1008)는 검색용 메타데이터 추출기(1007)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(1027)는 컨텐츠를 검색하기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(1027)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정할 수 있다. 그리고, 검색 디렉토리 결정기(1027)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1025)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(1027)에서 결정된 디렉토리에서 수행된다.
검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(1009)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색하는 것도 가능하다. 즉, 검색기(1009)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
*메타데이터 비교기(1010)는 검색용 편집기(1008)를 통해 입력된 메타데이터들과 검색기(1010)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(1011)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(1012)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(1012)는 부가서비스 데이터베이스(1011)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(1011)와 부가서비스 생성기(1012)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스 등이 포함된다.
검색결과 생성기(1013)는 메타데이터 비교기(1010)에서 출력되는 검색결과와 일치정도를 부가서비스 생성기(1012)에서 생성된 부가서비스를 부가한다.
검색결과 표시기(1026)는 검색결과 생성기(1013)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(1012)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(1013)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
이하에서는, 추천 디렉토리(30)에 돌잔치 경험담을 곁들어 중국음식점을 추천하는 글이 계시된 경우를 상정하고, 이 글을 정보로 저장하는 과정에 대해, 도 11을 참조하여 상세히 설명한다. 도 11은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다.
먼저, 디렉토리 컨텐츠 크롤러(1024)는 도 11의 (a)에 도시된 바와 같이 추천 디렉토리(30)에 게시된 추천문을 수집하여 형태소 처리기(1022)로 전달한다.
그러면, 형태소 처리기(1022)는 형태소 사전(1023)를 참조하여, 형태소 처리를 수행한다. 형태소 처리기(1022)에 의한 형태소 처리결과는, 도 11의 (b)에 나타난 바와 같다.
이후, 구문 해석기(1020)는 도 11의 (b)에 대해 구문 해석을 수행한다. 구문 해석기(1020)에 의한 구문 해석결과는 도 11의 (c)에 나타난 바와 같다.
그리고, 컨텐츠 제공자 의도 파악기(1018)는 도 11의 (c)를 기초로 제공자의 의도를 파악한다. 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 제공자의 의도는 도 11의 (d)에 나타난 바와 같다.
이후, 정보 제공용 메타데이터 추출기(1016)는 제공자의 의도에 부합하는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출한다.
정보 제공용 편집기(1015)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 사용자에게 제공한다.
도 11의 (d)에서 "돌잔치→장소→추천"에 부합하는 컨텐츠는 "돌잔치 장소제공" 컨텐츠이다. 정보 제공용 편집기(1015)는 컨텐츠 제공자 의도 파악기(1018)에 의해 파악된 컨텐츠 제공자의 의도를 도 11의 (e)와 같이 정리한다. 그리고, 정보 제공용 편집기(1015)는 도 12의 (a)에 도시된 편집기의 각 항목에 해당 메타데이터를 자동으로 입력하며, 입력된 결과는 도 12의 (b)에 도시된 바와 같다.
저장 디렉토리 결정기(1028)는 컨텐츠가 저장되기에 적합한 정보 DB(1025) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1028)는 정보 제공자 의도 파악기(1018)가 파악한 컨텐츠 제공자의 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1014)는 정보 제공용 편집기(1015)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1025)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1028)에 의해 결정된 디렉토리에 저장된다.
본 실시예에 따르면, 컨텐츠 제공자의 의도를 기초로 해당하는 정보를 디렉토리 별로 구분하되, 이에 해당하는 메타데이터들을 매칭시켜 저장할 수 있게 된다.
*이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검색자가 입력한 검색어를 기초로 검색을 수행하는 과정에 대해, 도 13를 참조하여 상세히 설명한다.
도 13은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어를 입력하면, 검색자의 검색 의도를 파악하고, 파악된 검색자의 의도를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 13에 도시된 바와 같이, 먼저 정보검색창(1001)을 통해 사용자가 검색어 "이번 토요일 볼만한 뮤지컬 추천 바람"을 입력하면(1301), 검색어 형태소 처리기(1003)는 입력된 검색어를 품사 별로 분리하여 (이번/토요일/볼만한/뮤지컬/추천/바람)으로 출력함과 동시에(1302), (명사/현재, 명사/요일, 형용사/호감, 명사/뮤지컬, 명사/추천, 동사/요청)의 품사정보와 의미정보를 부가하여 출력한다(1303).
그러면, 검색어 구문 해석기(1004)는 형태소 처리 결과를 토대로 구문 해석을 수행하여, 그 결과로 (이번→토요일, 볼만한→뮤지컬, →추천, →바람)를 출력한다(1304).
구문 해석결과, 이 예문에서는 문맥지각형 정보가 2가지 있음을 알 수 있다. 하나는 "모든 토요일"이라는 실제 물리적 데이터로서 "날짜"이고, 다른 하나는 "추천, 요청"이라는 "의도"이다.
따라서, 검색어 구문 해석기(1004)는 전자에 대해 문맥지각 처리를 수행하는데, 이하에서 상세히 설명한다.
먼저, "이번 토요일"에 대해 문맥지각형 리얼 데이터를 생성하는 과정에 대해 상세히 설명한다. 도 14는 때를 나타내는 문맥지각형 단어들인데, 이들은 형태소 사전(1023)에 수록될 수 있다. 도 14에 도시된 바와 같이 각 언어의 의미정보는 "과거", "현재", "미래" 등으로 정의되어 있다.
도 15는 "현재시각"을 "년", "월", "일", "요일", "시", "분", "초" 단위로 지정하여 시스템에서 관리하는 것을 나타낸 도면이다.
도 16에서는 "이번 토요일" 이란 언어표현을 오늘 현재시각에서 정량적으로 계산해내는 방식을 나타내고 있다. 즉, 구하고자 하는 것은 때를 나타내는 언어표현에서 실제 정량적인 시각이므로 "이번 토요일"을 형태소 처리하면 "이번/현재, 토요일/토요일"의 의미정보에서 현재시각의 요일을 시스템 카렌더에서 구하며 "수요일"이고 현재의 시스템 "토요일"은 "수→목→금→토"의 3일 후이므로 현재의 날짜 2008년 11월 6일에 3일을 더하면 2008년 11월 9일이라는 리얼 데이터를 생성할 수 있다.
이와 같은 과정에 의해, 현재와 다른 때를 나타내는 언어표현도 리얼 데이터로 변형할 수 있게 된다. 도 14 내지 도 16를 참조하여 설명한 "이번 토요일"에 대해 문맥지각형 리얼 데이터를 생성은, 도 13의 1306, 1307 및 1308에 해당한다.
한편, 검색자 의도 파악기(1005)는 구문 해석 결과를 이용하여, 검색자의 의도를 '뮤지컬→추천→요청'으로 파악한다(1308).
그러면, 검색용 메타데이터 추출기(1007)는 검색자의 의도인 '뮤지컬 추천 요청'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1017)로부터 추출하고, 검색용 편집기(1008)는 검색용 메타데이터 추출기(1007)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(1311). 이때, 생성된 리얼 데이터인 공연날짜 "2008.11.9"는 편집기에 자동으로 입력된다.
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(1312).
검색 디렉토리 결정기(1027)는 컨텐츠를 검색하기에 적합한 정보 DB(1025) 상의 디렉토리를 결정하고, 검색기(1009)는 검색용 편집기(1008)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1025)에서 검색한다(1313). 검색은 검색 디렉토리 결정기(1027)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(1027)는 검색자 의도 파악기(1005)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(1009)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(1010)는 검색용 편집기(1008)를 통해 입력된 메타데이터들과 검색기(1009)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(1314). 그리고, 메타데이터 비교기(1010)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(1315).
지금까지, 검색자가 입력한 정보로부터 검색자의 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하되 리얼 데이터 생성이 가능한 메타 데이터는 자동으로 입력되도록 하고, 이 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
지금까지 설명한 실시예들에서는, 정보 제공자 또는 정보 검색자의 의도를 입력된 언어 표현을 분석하여 자동으로 파악하였다.
예를 들어, "구하다, 사다, 구매하다, 주시다, 요청하다, 청하다, 찾다" 등의 언어 표현이 포함된 표현은 모두 "정보를 찾는다"라는 의미에서 정보 "검색"의 의미로 "정보검색"이라는 의도로 파악하여 처리하는 한편, "팔다, 판매하다, 제공하다, 드리다, 주다" 등의 언어 표현이 포함된 표현은 모두 "정보를 제공하다" 라는 의미에서 정보 "제공"의 의미로 "정보제공"이라는 의도로 파악하여 처리하였다.
이하에서 설명할 실시예는, 정보 제공자와 정보 검색자의 의도를 자동으로 파악하는 것이 아니라, 정보 제공자 또는 정보 검색자가 직접 입력하도록 한 방식이 채택된다. 이는, 정보 제공자와 정보 검색자의 의도를 보다 정확하게 파악하기 위함이다.
도 17은 이를 적용한 실시예에 따른 검색시스템을 도시한 도면이다. 본 실시예에 따른 검색시스템을 구성하는 블럭들은 S/W로 구현할 수 있음은 물론 H/W로 구현할 수 있다. 또한, 검색시스템을 구성하는 블럭들 중 일부는 S/W로 나머지는 H/W로 구현하는 것도 가능하다.
본 실시예에 따른 검색시스템은, 도 17에 도시된 바와 같이, 정보 제공/검색창(1701), 형태소 처리기(1702), 형태소 사전(1703), 구문 해석기(1704), 구문문법 규칙사전(1705), 의도 지정기(1706), 정보 모니터(1707), 정보 제공용 메타데이터 추출기(1708), 정보 제공용 편집기(1709), 저장 디렉토리 결정기(1710), 정보 저장기(1711), 정보 DB(1712), 메타데이터 DB(1713), 검색용 메타데이터 추출기(1714), 검색용 편집기(1715), 검색 디렉토리 결정기(1716), 검색기(1717), 메타데이터 비교기(1718), 검색 결과 생성기(1719), 검색결과 표시기(1720), 부가서비스 데이터베이스(1721) 및 부가서비스 생성기(1722)를 포함한다.
정보 제공/검색창(1701)은 정보 제공자가 등록시키고자 하는 정보를 입력하거나, 정보 검색자가 검색어를 입력하는데 이용되는 사용자 인터페이스이다.
정보 제공/검색창(1701)에는 입력창(1701-1), 정보제공 버튼(1701-2) 및 정보검색 버튼(1701-3)이 마련되어 있다. 입력창(1701-1)은 제공하고자 정보 또는 검색어를 입력하는데 이용되는 창이며, 이 입력창(1701-1)에는 정보와 검색어가 단어, 구 또는 문장으로 입력될 수 있다.
정보제공 버튼(1701-2)은 입력창(1701-1)에 입력된 정보를 제공/등록하고자 할 때 이용되는 버튼이며, 정보검색 버튼(1701-3)은 입력창(1701-1)에 입력된 검색어에 대한 정보검색을 명령하는데 이용되는 버튼이다.
정보 제공/검색창(1701)을 통해 입력된 정보 또는 검색어는 형태소 처리기(1702)로 전달된다.
형태소 사전(1703)은 도 1에 도시된 형태소 사전(125)과 동일한 것으로 구현할 수 있다. 형태소 처리기(1702)는 형태소 사전(1023)를 참조하여, 정보 제공/검색창(1701)을 통해 입력된 정보 또는 검색어를 품사 별로 분리하여 출력한다.
구문 해석기(1704)는 형태소 처리기(1702)의 형태소 처리 결과를 토대로, 사용자가 입력한 정보 또는 검색어에 대해 구문 해석을 수행한다. 구문 해석기(1704)는 구문 해석을 수행함에 있어, 구문문법 규칙사전(1705)에 수록되어 있는 문법 규칙을 참조한다.
의도 지정기(1706)는 정보 제공자의 의도 또는 정보 검색자의 의도를 직접 지정받기 위한 사용자 인터페이스 수단을 제공하며, 구문 해석 결과에 지정된 의도를 통합하여 궁극적인 의도를 출력한다.
정보 모니터(1707)는 의도 지정기(1706)에서 출력되는 궁극적인 의도를 사용자가 볼 수 있도록 출력한다. 이를 위해, 정보 모니터(1707)는 그래픽 툴을 이용할 수 있다.
정보 제공용 메타데이터 추출기(1708)는 의도 지정기(1706)에서 출력되는 정보 제공자의 궁극적인 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다.
정보 제공용 편집기(1709)는 정보 제공용 메타데이터 추출기(1708)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다.
저장 디렉토리 결정기(1710)는 컨텐츠가 저장되기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다. 이때, 저장 디렉토리 결정기(1710)는 의도 지정기(1706)가 파악한 정보 제공자의 궁극적인 의도를 참조하여 디렉토리를 결정할 수 있다.
정보 저장기(1711)는 정보 제공용 편집기(1709)에 의해 생성된 메타데이터들을 통합한 컨텐츠를 정보 DB(1712)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1710)에 의해 결정된 디렉토리에 저장된다.
검색용 메타데이터 추출기(1714)는 의도 지정기(1706)에서 출력되는 정보 검색자의 궁극적인 의도에 맞는 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다.
검색용 편집기(1715)는 검색용 메타데이터 추출기(1714)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다.
검색 디렉토리 결정기(1716)는 컨텐츠를 검색하기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다. 이때, 검색 디렉토리 결정기(1716)는 의도 지정기(1706)에서 출력되는 검색자의 궁극적인 의도를 참조하여 디렉토리를 결정할 수 있다.
그리고, 검색 디렉토리 결정기(1716)는 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1712)에서 검색한다. 이때, 검색은 검색 디렉토리 결정기(1716)에서 결정된 디렉토리에서 수행된다.
검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들을 동의의 메타데이터들로 교체하여 검색하는 확장 검색을 수행하는 것도 가능함은 물론이다.
또한, 검색기(1717)는 메타데이터와 구조 및 단어가 완전히 동일한 메타데이터 뿐만 아니라, 구조와 단어가 일부만 동일한 메타데이터를 가지는 컨텐츠를 검색하는 것도 가능하다. 즉, 검색기(1717)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색도 가능한 것이다.
메타데이터 비교기(1718)는 검색용 편집기(1715)를 통해 입력된 메타데이터들과 검색기(1717)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교하고, 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다. 이와 같은, 비교(일치정도 판단)는 테이블 형식으로 이루어진 메타데이터들 각각을 비교하는 방법에 의해 가능하다.
부가서비스 데이터베이스(1721)에는 검색자의 검색 의도에 적합한 사이트 정보 또는 관련 광고서비스를 제공하는 수단 등이 저장되어 있다.
부가서비스 생성기(1722)는 검색키와 관련한 부가서비스를 생성한다. 이를 위해, 부가서비스 생성기(1722)는 부가서비스 데이터베이스(1721)에 저장되어 있는 부가서비스들 중 검색자의 검색 의도에 적합한 부가서비스를 이용한다.
부가서비스 데이터베이스(1721)와 부가서비스 생성기(1722)에 의해 제공되는 부가서비스는 컨텐츠 문맥 지각형(Context awareness) 서비스로 구현할 수 있다. 이때, 컨텐츠 문맥 지각형 서비스에는 안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 행정서비스 등이 포함된다.
검색 결과 생성기(1719)는 메타데이터 비교기(1718)에서 출력되는 검색결과(컨텐츠들)와 일치정도를 부가서비스 생성기(1722)에서 생성된 부가서비스를 부가한다.
검색결과 표시기(1720)는 검색 결과 생성기(1719)에서 생성된 부가서비스가 부가된 검색결과를 화면을 통해 출력하여 사용자에게 제공한다.
한편, 부가서비스 없이 검색결과와 일치정도만을 사용자에게 제공하는 것이 가능하다. 이 경우는, 부가서비스 생성기(1722)가 부가서비스를 생성하지 않도록 하거나, 생성하더라도 검색 결과 생성기(1719)가 생성된 부가서비스를 부가하지 않도록 하는 방식에 의해 가능하다.
도 18은 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 흐름도이다.
도 18에 도시된 바와 같이, 정보 제공/검색창(1701)의 입력창(1701-1)에 사용자가 "수업시간표"를 입력하고 정보제공 버튼(1701-2)을 누르면(1801), 형태소 처리기(1702)는 형태소 사전(1703)를 참조하여, "수업시간표"를 품사 별로 분리하여 "수업/시간표"로 출력한다(1802).
그러면, 구문 해석기(1704)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (수업→시간표)를 출력한다(1803).
이후, 의도 지정기(1706)를 통해 정보 제공자의 의도가 "제공"으로 지정되면(1804,1805), 의도 지정기(1706)는 구문 해석 결과에 지정된 의도를 통합한 궁극적인 의도 "수업→시간표→제공"를 출력한다(1806).
그러면, 정보 제공용 메타데이터 추출기(1708)는 정보 제공자의 궁극적인 의도인 "수업→시간표→제공"에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출한다(1807).
정보 제공용 편집기(1709)는 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 정보 제공자에게 제공한다(1808). 그러면, 정보제공자는 제공된 편집기를 통해 메타데이터들을 입력한다(1809).
그러면, 저장 디렉토리 결정기(1710)는 컨텐츠가 저장되기에 적합한 정보 DB(1712) 상의 디렉토리를 결정한다(1810).
그리고, 정보 저장기(1711)는 정보 제공용 편집기(1709)에 의해 입력된 메타데이터들을 통합한 컨텐츠를 정보 DB(1712)에 저장한다. 이때, 컨텐츠는 저장 디렉토리 결정기(1710)에 의해 결정된 디렉토리에 저장된다.
지금까지, 정보 제공자가 입력한 정보와 의도를 통해 정보 제공자의 궁극적인 의도를 파악하고, 파악된 의도를 기초로 세부적인 메타데이터 입력을 유도하여 하나의 컨텐츠로 저장하는 과정에 대해 상세히 설명하였다.
이하에서는, 위와 같은 과정으로 저장된 메타 데이터들을 이용하여 정보 검색자가 입력한 검색어와 의도를 기초로 검색을 수행하는 과정에 대해, 도 19를 참조하여 상세히 설명한다.
도 19는 본 발명의 또 다른 실시예에 따른 검색방법의 설명에 제공되는 도면이다. 본 실시예에서는, 정보 검색자가 검색어와 의도를 이를 토대로 세부적이고 정확한 검색이 가능하도록 한다. 여기서, 사용자가 입력하는 검색어는 단어는 물론이고, 구나 문장인 경우도 포함된다.
도 19에 도시된 바와 같이, 정보 제공/검색창(1701)의 입력창(1701-1)에 사용자가 "일정표"를 입력하고 검색 버튼(1701-3)을 누르면(1901), 형태소 처리기(1702)는 형태소 사전(1703)를 참조하여, "일정표"를 품사 별로 분리하여 "일정/표"로 출력한다(1902).
그러면, 구문 해석기(1704)는 형태소 처리 결과에 대해 구문 해석을 수행하여 그 결과인 (일정→표)를 출력한다(1903).
이후, 의도 지정기(1706)를 통해 정보 제공자의 의도가 "검색"으로 지정되면(1904,1905), 의도 지정기(1706)는 구문 해석 결과에 지정된 의도를 통합한 궁극적인 의도 "일정→표→검색"를 출력한다(1906).
그러면, 검색용 메타데이터 추출기(1714)는 검색자의 궁극적인 의도인 '일정→표→검색'에 적합한 컨텐츠에 대한 메타데이터들을 메타데이터 DB(1713)로부터 추출하고, 검색용 편집기(1715)는 검색용 메타데이터 추출기(1714)가 추출한 메타데이터들이 입력 항목으로 되어 있는 편집기를 생성하여, 검색자에게 제공한다(1908).
그러면, 검색자는 제공된 편집기를 통해 메타데이터들을 입력한다(1909).
검색 디렉토리 결정기(1716)는 컨텐츠를 검색하기에 적합한 정보 DB(1712) 상의 디렉토리를 결정하고(1910), 검색기(1717)는 검색용 편집기(1715)에 의해 입력된 메타데이터들과 동일한 메타데이터들을 가지는 컨텐츠를 정보 DB(1712)에서 검색한다(1911). 검색은 검색 디렉토리 결정기(1716)에서 결정된 디렉토리에서 수행된다.
이때, 검색 디렉토리 결정기(1716)는 의도 지정기(1706)가 파악한 검색자의 의도를 참조하여 디렉토리를 결정하는데, 결정된 디렉토리와 유사한 디렉토리들을 추가적으로 결정하는 것이 가능하다. 보다 폭넓은 검색이 가능하도록 하기 위함이다.
그리고, 검색기(1717)는 동일 검색 뿐만 아니라, 부분 검색이나 연관 검색을 수행할 수도 있다.
이후, 메타데이터 비교기(1718)는 검색용 편집기(1715)를 통해 입력된 메타데이터들과 검색기(1717)가 검색한 컨텐츠를 구성하는 메타데이터들을 비교한다(1912). 그리고, 메타데이터 비교기(1718)는 비교결과 일치도가 높은 컨텐츠들만을 선별하여 출력한다(1913).
지금까지, 검색자가 입력한 정보와 의도를 기초로 세부적인 메타데이터 입력을 유도하고, 입력된 메타데이터를 이용하여 검색자의 의도에 부합하는 디렉토리에서 검색을 수행하는 과정에 대해 상세히 설명하였다.
지금까지 설명한 실시예는, 전자투표용 입후보자의 홍보 제공용으로 이용될 수 있다.
정보 제공/검색창(1701)에 사용자가 "입후보자 홍보 제공"을 입력하여, 형태소 처리, 구문 해석, 의도 지정 및 메타데이터 추출을 거친 후에 생성되는 편집기와 정보제공자가 제공된 편집기에 메타데이터들을 입력한 결과를, 도 20에 도시하였다.
이후, 저장 디렉토리 결정을 거쳐 정보 DB(1712)에 정보를 저장하면, 입후보자에 대한 홍보물을 PC, 휴대폰 등을 이용하여 유권자에게 배포할 수 있게 된다. 이에 따르면, 현재 이용중인 종이포스터에 의한 입후보자 홍보물을 값싸고, 신속하게 제공할 수 있게 된다.
지금까지 설명한 실시예들은, 휴대폰과 같은 모바일 정보기기들은 물론 여타의 정보기기들에서 구현가능하다. 또한, 정보제공 버튼 및 정보검색 버튼은 휴대폰과 같은 모바일 정보기기들은 물론 여타의 정보기기들의 특정 버튼(키)에 대응/할당할 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims (30)

  1. 검색어에 대한 해석결과를 이용하여, 검색자의 의도를 파악하는 단계;
    상기 검색자의 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함하는 것을 특징으로 하는 정보 검색방법.
  2. 제 1항에 있어서,
    입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및
    분리된 검색어들을 구문 해석하는 단계;를 더 포함하고,
    상기 검색자의 의도 파악단계는,
    상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 검색자의 의도를 파악하는 것을 특징으로 하는 정보 검색방법.
  3. 제 2항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것을 특징으로 하는 정보 검색방법.
  4. 제 3항에 있어서,
    상기 구문 표현식은,
    논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것을 특징으로 하는 정보 검색방법.
  5. 제 3항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며,
    상기 구문문법 규칙사전은,
    구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것을 특징으로 하는 정보 검색방법.
  6. 제 2항에 있어서,
    상기 분리단계는,
    상기 검색어를 품사 별로 분리하는 것을 특징으로 하는 정보 검색방법.
  7. 제 6항에 있어서,
    상기 분리단계는,
    형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 검색어를 품사 별로 분리하는 것을 특징으로 하는 정보 검색방법.
  8. 제 1항에 있어서,
    상기 검색자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고,
    상기 편집기 제공단계는,
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 검색자의 의도에 맞는 편집기로 제공하는 것을 특징으로 하는 정보 검색방법.
  9. 제 1항에 있어서,
    상기 정보 제공자의 의도를 참조하여 검색을 수행할 디렉토리를 결정하는 단계;를 더 포함하고,
    상기 검색 단계는,
    결정된 디렉토리와 동일 또는 유사한 디렉토리에서 상기 컨텐츠를 검색하는 것을 특징으로 하는 정보 검색방법.
  10. 제 1항에 있어서,
    상기 검색어는,
    단어 단위, 구 단위 및 문장 단위 중 어느 하나인 것을 특징으로 하는 정보 검색방법.
  11. 제 1항에 있어서,
    상기 검색단계는,
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동일한 메타데이터 또는 상기 편집기의 입력 항목들을 통해 입력된 메타데이터들 중 적어도 하나와 동의의 메타데이터를 가지는 컨텐츠를 검색하는 것을 특징으로 하는 정보 검색방법.
  12. 제 1항에 있어서,
    상기 검색단계에서의 검색결과에 부가서비스를 부가하는 단계;를 더 포함하는 것을 특징으로 하는 정보 검색방법.
  13. 제 12항에 있어서,
    상기 부가서비스는, 컨텐츠 문맥 지각형(Context awareness) 서비스이고,
    상기 컨텐츠 문맥 지각형은,
    안내서비스, 매매서비스, 광고서비스, 교육서비스, 상담서비스, 추천서비스, 경매서비스 및 행정서비스 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 검색방법.
  14. 제 1항에 있어서,
    상기 편집기의 입력 항목들 중 적어도 하나는, 상기 검색어를 이용하여 생성한 리얼데이터로 자동입력되는 것을 특징으로 하는 정보 검색방법.
  15. 제 1항에 있어서,
    상기 입력된 메타데이터들 및 검색된 컨텐츠를 구성하는 메타데이터들을 각각 비교하여 일치도가 높은 컨텐츠들을 선별하여 출력하는 단계;를 더 포함하는 것을 특징으로 하는 정보 검색방법.
  16. 정보에 포함된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계;
    상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하는 것을 특징으로 하는 검색용 정보 제공방법.
  17. 제 16항에 있어서,
    입력된 정보에 포함된 상기 텍스트를 의미 있는 단어들로 분리하는 단계; 및
    분리된 단어들을 구문 해석하는 단계;를 더 포함하고,
    상기 정보 제공자의 의도 파악단계는,
    상기 구문 해석단계에서의 구문 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 것을 특징으로 하는 검색용 정보 제공방법.
  18. 제 17항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하여 얻어지는 구문 표현식을 상기 구문 해석결과로 출력하는 것을 특징으로 하는 검색용 정보 제공방법.
  19. 제 18항에 있어서,
    상기 구문 표현식은,
    논리식, 수식-피수식 및 구문목 리스트식 중 적어도 하나인 것을 특징으로 하는 검색용 정보 제공방법.
  20. 제 18항에 있어서,
    상기 구문 해석단계는,
    상기 분리된 단어들이 문장 내에서 어떠한 문법적 관계 및 의미적 관계를 가지는지를 해석하기 위해, 구문문법 규칙사전을 참조하며,
    상기 구문문법 규칙사전은,
    구구조문법, 격문법, 의존문법 및 어휘문법 중 적어도 하나가 수록되어 있는 것을 특징으로 하는 검색용 정보 제공방법.
  21. 제 17항에 있어서,
    상기 분리단계는,
    상기 텍스트를 품사 별로 분리하는 것을 특징으로 하는 검색용 정보 제공방법.
  22. 제 21항에 있어서,
    상기 분리단계는,
    형태소 사전에 데이터 베이스화되어 있는 각 단어의 품사에 대한 정보를 참조하여, 상기 텍스트를 품사 별로 분리하는 것을 특징으로 하는 검색용 정보 제공방법.
  23. 제 16항에 있어서,
    상기 정보 제공자의 의도에 맞는 컨텐츠에 대한 메타데이터들을 추출하는 단계;를 더 포함하고,
    상기 편집기 제공단계는,
    추출된 메타데이터들이 입력 항목으로 되어 있는 편집기를, 상기 정보 제공자의 의도에 맞는 편집기로 제공하는 것을 특징으로 하는 검색용 정보 제공방법.
  24. 제 16항에 있어서,
    상기 정보 제공자의 의도를 참조하여 상기 정보가 저장될 디렉토리를 결정하는 단계;를 더 포함하고,
    상기 컨텐츠 저장단계는,
    결정된 디렉토리에 상기 컨텐츠를 저장하는 것을 특징으로 하는 검색용 정보 제공방법.
  25. 제 16항에 있어서,
    디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;를 더 포함하고,
    상기 파악 단계는,
    수집된 텍스트에 대한 해석결과를 이용하는 것을 특징으로 하는 검색용 정보 제공방법.
  26. 디렉토리 별로 구분되어 있는 컨텐츠에 포함되어 있는 텍스트를 수집하는 단계;
    수집된 텍스트에 대한 해석결과를 이용하여, 상기 정보를 제공한 정보 제공자의 의도를 파악하는 단계;
    상기 정보 제공자의 의도에 맞는 편집기를 사용자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하는 것을 특징으로 하는 검색용 정보 제공방법.
  27. 검색어를 입력받는 단계;
    상기 검색어를 입력한 검색자의 의도를 입력받는 단계;
    상기 검색어에 대한 해석결과와 상기 검색자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 검색자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들과 관련된 메타데이터를 가지는 컨텐츠를 검색하는 단계;를 포함하는 것을 특징으로 하는 정보 검색방법.
  28. 제 27항에 있어서,
    입력된 검색어를 의미 있는 단어들로 분리하는 단계; 및
    분리된 검색어들을 구문 해석하는 단계;를 더 포함하고,
    상기 편집기 제공단계는,
    상기 구문 해석단계에서의 구문 해석결과를 이용하는 것을 특징으로 하는 정보 검색방법.
  29. 정보를 입력받는 단계;
    상기 정보를 입력한 정보 제공자의 의도를 입력받는 단계;
    상기 정보에 대한 해석결과와 상기 정보 제공자의 의도를 통합한 궁극적인 의도에 맞는 편집기를 상기 정보 제공자에게 제공하는 단계; 및
    상기 편집기의 입력 항목들을 통해 입력된 메타데이터들을 통합한 컨텐츠를 저장하는 단계;를 포함하는 것을 특징으로 하는 검색용 정보 제공방법.
  30. 제 29항에 있어서,
    입력된 정보를 의미 있는 단어들로 분리하는 단계; 및
    분리된 단어들을 구문 해석하는 단계;를 더 포함하고,
    상기 편집기 제공 단계는,
    상기 구문 해석단계에서의 구문 해석결과를 이용하는 것을 특징으로 하는 검색용 정보 제공방법.
PCT/KR2009/007443 2008-12-11 2009-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 WO2010068068A2 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN200980150114.1A CN102246164B (zh) 2008-12-11 2009-12-11 基于用户意图的信息搜索方法以及信息提供方法
JP2011540611A JP5481615B2 (ja) 2008-12-11 2009-12-11 使用者の意図に基づく情報検索方法及び情報提供方法
US13/139,118 US9256679B2 (en) 2008-12-11 2009-12-11 Information search method and system, information provision method and system based on user's intention

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080125767A KR101042515B1 (ko) 2008-12-11 2008-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
KR10-2008-0125767 2008-12-11

Publications (2)

Publication Number Publication Date
WO2010068068A2 true WO2010068068A2 (ko) 2010-06-17
WO2010068068A3 WO2010068068A3 (ko) 2010-09-16

Family

ID=42243243

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2009/007443 WO2010068068A2 (ko) 2008-12-11 2009-12-11 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법

Country Status (5)

Country Link
US (1) US9256679B2 (ko)
JP (1) JP5481615B2 (ko)
KR (1) KR101042515B1 (ko)
CN (1) CN102246164B (ko)
WO (1) WO2010068068A2 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883341A (zh) * 2010-06-29 2010-11-10 中国人民大学 一种基于短信终端的信息查询***及查询方法
WO2012145906A1 (en) 2011-04-28 2012-11-01 Microsoft Corporation Alternative market search result toggle
CN103703488A (zh) * 2011-07-19 2014-04-02 Sk普兰尼特有限公司 智能信息提供***和方法
CN107027065A (zh) * 2017-04-21 2017-08-08 海信集团有限公司 非标准频道名称的识别方法和装置
KR20190113712A (ko) * 2012-09-10 2019-10-08 구글 엘엘씨 환경 콘텍스트를 이용한 질문 답변

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101106772B1 (ko) * 2009-05-14 2012-01-18 주식회사 솔트룩스 사용자 선호 지식 베이스 기반의 컨텐츠 추천 방법 및 시스템
EP2508896B1 (en) * 2009-12-03 2019-04-17 Hitachi High-Technologies Corporation Automatic analyzing device
TWI480742B (zh) * 2011-03-18 2015-04-11 Ind Tech Res Inst 基於動態語言模型之推薦方法與推薦系統
CN103164449B (zh) * 2011-12-15 2016-04-13 腾讯科技(深圳)有限公司 一种搜索结果的展现方法与装置
KR101347123B1 (ko) * 2012-04-17 2014-01-03 박석일 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체
US9747373B2 (en) 2012-05-11 2017-08-29 Zte Corporation Inquiry method and system, inquiry search server and inquiry terminal
GB2503223A (en) 2012-06-19 2013-12-25 Ibm Redrafting text strings using a vocabulary
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
CN102866989B (zh) * 2012-08-30 2016-09-07 北京航空航天大学 基于词语依存关系的观点抽取方法
CN102880723B (zh) * 2012-10-22 2015-08-05 深圳市宜搜科技发展有限公司 一种识别用户检索意图的搜索方法和***
US9383216B2 (en) 2012-10-31 2016-07-05 International Business Machines Corporation Providing online mapping with user selected preferences
KR20140119217A (ko) * 2013-03-27 2014-10-10 (주)네오넷코리아 키워드 검색을 통해 사진 검색이 가능한 사진 공유 시스템 및 사진 공유 방법
CN104077320B (zh) * 2013-03-29 2019-12-17 北京百度网讯科技有限公司 一种用于生成待发布信息的方法和装置
DK2994908T3 (da) 2013-05-07 2019-09-23 Veveo Inc Grænseflade til inkrementel taleinput med realtidsfeedback
CN104142955A (zh) * 2013-05-08 2014-11-12 ***通信集团浙江有限公司 一种推荐学习课程的方法和终端
CN103400273A (zh) * 2013-07-18 2013-11-20 苏州悦驾信息科技有限公司 本地化汽车o2o服务***
WO2015037814A1 (ko) * 2013-09-16 2015-03-19 고려대학교 산학협력단 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법
KR20150062832A (ko) * 2013-11-29 2015-06-08 현대엠엔소프트 주식회사 내비게이션의 검색 방법 및 그 장치
US10778618B2 (en) * 2014-01-09 2020-09-15 Oath Inc. Method and system for classifying man vs. machine generated e-mail
CN104462212B (zh) * 2014-11-04 2017-12-22 百度在线网络技术(北京)有限公司 信息展示方法和装置
KR102094934B1 (ko) * 2014-11-19 2020-03-31 한국전자통신연구원 자연어 질의 응답 시스템 및 방법
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US20160224524A1 (en) * 2015-02-03 2016-08-04 Nuance Communications, Inc. User generated short phrases for auto-filling, automatically collected during normal text use
US20160283845A1 (en) * 2015-03-25 2016-09-29 Google Inc. Inferred user intention notifications
US10956957B2 (en) * 2015-03-25 2021-03-23 Facebook, Inc. Techniques for automated messaging
KR101656741B1 (ko) * 2015-04-23 2016-09-12 고려대학교 산학협력단 프레임 기반 의견스팸 판단장치, 프레임 기반 의견스팸 판단방법, 프레임 기반으로 의견스팸을 판단하기 위한 컴퓨터 프로그램 및 컴퓨터 판독가능 기록매체
CN104899308A (zh) * 2015-06-12 2015-09-09 北京奇虎科技有限公司 用于浏览器页面出错时的信息推荐方法及装置
WO2017017738A1 (ja) * 2015-07-24 2017-02-02 富士通株式会社 符号化プログラム、符号化装置、及び符号化方法
CN105068661B (zh) * 2015-09-07 2018-09-07 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和***
CN105425978A (zh) * 2015-10-26 2016-03-23 百度在线网络技术(北京)有限公司 输入数据的处理方法及装置
US10613825B2 (en) * 2015-11-30 2020-04-07 Logmein, Inc. Providing electronic text recommendations to a user based on what is discussed during a meeting
WO2017163346A1 (ja) * 2016-03-23 2017-09-28 株式会社野村総合研究所 文章解析システム及びプログラム
CN106407181B (zh) * 2016-09-07 2019-05-14 武汉众犇慧通科技有限公司 旅游目的地中的数据语义关联分析方法及***
US10650621B1 (en) 2016-09-13 2020-05-12 Iocurrents, Inc. Interfacing with a vehicular controller area network
CN106599304B (zh) * 2016-12-29 2020-03-24 中南大学 一种针对中小型网站的模块化用户检索意图建模方法
US10009462B1 (en) * 2017-03-28 2018-06-26 International Business Machines Corporation Call filtering to a user equipment
CN107832432A (zh) * 2017-11-15 2018-03-23 北京百度网讯科技有限公司 一种搜索结果排序方法、装置、服务器和存储介质
CN108228191B (zh) * 2018-02-06 2022-01-25 威盛电子股份有限公司 语法编译***以及语法编译方法
TWI660341B (zh) * 2018-04-02 2019-05-21 和碩聯合科技股份有限公司 一種搜尋方法以及一種應用該方法的電子裝置
KR102072723B1 (ko) * 2018-05-25 2020-02-03 에스케이텔레콤 주식회사 콘텐츠 추천어 제공 방법 및 그 콘텐츠 제공 장치
US20210240930A1 (en) * 2018-06-13 2021-08-05 Sony Corporation Information processing apparatus and method for processing information
CN110347910A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个电子商务网站搜索结果过滤规则
CN110413882B (zh) * 2019-07-15 2023-10-31 创新先进技术有限公司 信息推送方法、装置及设备
CN115668206A (zh) 2020-03-10 2023-01-31 梅特凯股份有限公司 推动多语言、多轮次、多领域虚拟助理的并行假设推理
US11995561B2 (en) 2020-03-17 2024-05-28 MeetKai, Inc. Universal client API for AI services
WO2021188719A1 (en) 2020-03-17 2021-09-23 MeetKai, Inc. An intelligent layer to power cross platform, edge-cloud hybrid artificail intelligence services
CN111475722B (zh) * 2020-03-31 2023-04-18 百度在线网络技术(北京)有限公司 用于发送信息的方法和装置
CN111625706B (zh) * 2020-05-22 2023-05-30 北京百度网讯科技有限公司 信息检索方法、装置、设备及存储介质
WO2021262605A1 (en) * 2020-06-24 2021-12-30 MeetKai, Inc. A system and method for handling out of scope or out of domain user inquiries
US11921712B2 (en) 2020-10-05 2024-03-05 MeetKai, Inc. System and method for automatically generating question and query pairs
TWI804763B (zh) * 2020-10-22 2023-06-11 楊蕙如 適合於通訊或社群平台的交易方法及系統
CN112883165B (zh) * 2021-03-16 2022-12-02 山东亿云信息技术有限公司 一种基于语义理解的智能全文检索方法及***
KR102625347B1 (ko) 2021-11-10 2024-01-15 동의대학교 산학협력단 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템
CN114169966B (zh) * 2021-12-08 2022-08-05 海南港航控股有限公司 一种用张量提取货物订单元数据的方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030006201A (ko) * 2001-07-12 2003-01-23 서정연 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
KR100786342B1 (ko) * 2007-01-30 2007-12-17 (주) 프람트 사용자 동적 정보를 이용한 콘텐츠의 검색 방법
KR20080052173A (ko) * 2006-12-05 2008-06-11 한국전자통신연구원 자연어 분석을 통한 미디어 정보 검색 방법

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962739A (ja) * 1995-08-22 1997-03-07 Hitachi Ltd 相談窓口割り当て方法および装置
KR100361166B1 (ko) 1999-11-13 2002-11-18 김시환 정보 검색 시스템 및 그 방법
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
KR20020028593A (ko) 2000-10-11 2002-04-17 김중문 유해 단어 차단 방법
KR100484944B1 (ko) 2002-12-24 2005-04-25 한국전자통신연구원 국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치
JP2004234421A (ja) * 2003-01-31 2004-08-19 Hitachi Kokusai Electric Inc 情報検索方法およびそれを用いた情報検索システム
JP2004302660A (ja) * 2003-03-28 2004-10-28 Toshiba Corp 質問応答システム、質問応答方法及びプログラム
US7660400B2 (en) * 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US7496500B2 (en) 2004-03-01 2009-02-24 Microsoft Corporation Systems and methods that determine intent of data and respond to the data based on the intent
JP2005258496A (ja) * 2004-03-09 2005-09-22 Hitachi Ltd 検索意図を表す文字列を利用した情報検索システム
KR20050092955A (ko) 2004-03-17 2005-09-23 (주)다음소프트 온라인 광고 시스템 및 광고 방법
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
KR100594500B1 (ko) 2004-07-30 2006-06-30 에스케이 텔레콤주식회사 메시지 분석을 통한 지역정보 제공 시스템 및 그 방법
US7565627B2 (en) * 2004-09-30 2009-07-21 Microsoft Corporation Query graphs indicating related queries
KR100670789B1 (ko) 2004-12-03 2007-01-17 한국전자통신연구원 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법
KR100597435B1 (ko) 2004-12-07 2006-07-10 한국전자통신연구원 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법
KR100669534B1 (ko) 2004-12-09 2007-01-16 학교법인 울산공업학원 문장추상화와 개연규칙을 활용하는 문서요약 방법과 시스템, 그리고 문장 의미 분석 및 표현방법
JP3999812B2 (ja) * 2005-01-25 2007-10-31 松下電器産業株式会社 音復元装置および音復元方法
KR20060087735A (ko) 2005-01-31 2006-08-03 삼성전자주식회사 개선된 스팸성 메시지 필터링을 제공하는 시스템 및 방법
US20060212142A1 (en) * 2005-03-16 2006-09-21 Omid Madani System and method for providing interactive feature selection for training a document classification system
JP2006285847A (ja) * 2005-04-04 2006-10-19 Konica Minolta Holdings Inc 画像検索システム、およびプログラム
KR100726603B1 (ko) 2005-08-01 2007-06-11 에스케이 텔레콤주식회사 광고 유발 메시징 서비스 시스템 및 그 방법
KR20070029389A (ko) 2005-09-09 2007-03-14 주식회사 엠퓨처 핵심 키워드를 이용한 광고 서비스 제공 방법, 시스템 및이를 구현하기 위한 프로그램이 기록된 기록매체
KR100775680B1 (ko) 2005-10-25 2007-11-09 에스케이 텔레콤주식회사 이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법및 그 시스템
JP4468294B2 (ja) * 2005-12-08 2010-05-26 日本電信電話株式会社 体験情報評価装置及びプログラム及びコンピュータ読み取り可能な記録媒体
KR100691400B1 (ko) 2006-03-31 2007-03-12 엔에이치엔(주) 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기
KR100857124B1 (ko) 2006-06-27 2008-09-05 성균관대학교산학협력단 유해 메시지 여과 시스템과 그 여과 방법 및 이를 기록한기록매체
US8255383B2 (en) * 2006-07-14 2012-08-28 Chacha Search, Inc Method and system for qualifying keywords in query strings
JP4722819B2 (ja) * 2006-11-29 2011-07-13 日本電信電話株式会社 情報公開システムおよび情報公開方法
KR100836878B1 (ko) 2006-11-29 2008-06-11 한국과학기술정보연구원 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그방법
KR100757951B1 (ko) 2007-01-02 2007-09-11 김수현 웹페이지의 형태소 분석을 통한 검색 방법
US20080172380A1 (en) * 2007-01-17 2008-07-17 Wojciech Czyz Information retrieval based on information location in the information space.
US7805450B2 (en) * 2007-03-28 2010-09-28 Yahoo, Inc. System for determining the geographic range of local intent in a search query
KR100892842B1 (ko) * 2007-08-08 2009-04-10 엔에이치엔(주) 사용자 중심 정보탐색 방법 및 시스템
US8301651B2 (en) * 2007-11-21 2012-10-30 Chacha Search, Inc. Method and system for improving utilization of human searchers
US20090313117A1 (en) * 2008-06-16 2009-12-17 Yahoo! Inc. Targeted advertising

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030006201A (ko) * 2001-07-12 2003-01-23 서정연 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
KR20080052173A (ko) * 2006-12-05 2008-06-11 한국전자통신연구원 자연어 분석을 통한 미디어 정보 검색 방법
KR100786342B1 (ko) * 2007-01-30 2007-12-17 (주) 프람트 사용자 동적 정보를 이용한 콘텐츠의 검색 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101883341A (zh) * 2010-06-29 2010-11-10 中国人民大学 一种基于短信终端的信息查询***及查询方法
WO2012145906A1 (en) 2011-04-28 2012-11-01 Microsoft Corporation Alternative market search result toggle
EP2702509A4 (en) * 2011-04-28 2015-05-20 Microsoft Technology Licensing Llc SEARCH RESULTS FOR ALTERNATIVE MARKETS
CN103703488A (zh) * 2011-07-19 2014-04-02 Sk普兰尼特有限公司 智能信息提供***和方法
CN103703488B (zh) * 2011-07-19 2019-09-17 Sk 普兰尼特有限公司 智能信息提供***和方法
KR20190113712A (ko) * 2012-09-10 2019-10-08 구글 엘엘씨 환경 콘텍스트를 이용한 질문 답변
KR102140177B1 (ko) 2012-09-10 2020-08-03 구글 엘엘씨 환경 콘텍스트를 이용한 질문 답변
CN107027065A (zh) * 2017-04-21 2017-08-08 海信集团有限公司 非标准频道名称的识别方法和装置

Also Published As

Publication number Publication date
KR20100067285A (ko) 2010-06-21
US20110246496A1 (en) 2011-10-06
CN102246164A (zh) 2011-11-16
JP2012511769A (ja) 2012-05-24
WO2010068068A3 (ko) 2010-09-16
KR101042515B1 (ko) 2011-06-17
US9256679B2 (en) 2016-02-09
JP5481615B2 (ja) 2014-04-23
CN102246164B (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
WO2010068068A2 (ko) 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
WO2010036012A2 (ko) 인터넷을 이용한 의견 검색 시스템, 의견 검색 및 광고 서비스 시스템과 그 방법
WO2020009297A1 (ko) 도메인 추출기반의 언어 이해 성능 향상장치및 성능 향상방법
WO2012074338A2 (ko) 자연어 및 수학식 처리 방법과 그를 위한 장치
WO2019177182A1 (ko) 속성 정보 분석을 통한 멀티미디어 컨텐츠 검색장치 및 검색방법
WO2020017849A1 (en) Electronic device and method for providing artificial intelligence services based on pre-gathered conversations
EP3398083A1 (en) Method and device for translating object information and acquiring derivative information
WO2010036013A2 (ko) 웹 문서에서의 의견 추출 및 분석 장치 및 그 방법
WO2017209564A1 (ko) 앱 리스트 제공 방법 및 그 장치
WO2011007935A1 (ko) 홈페이지 통합 서비스 제공 시스템 및 방법
WO2013168860A1 (en) Method for displaying text associated with audio file and electronic device
WO2014021567A1 (ko) 메시지 서비스 제공 방법, 이를 위한 장치 및 시스템
WO2022065811A1 (en) Multimodal translation method, apparatus, electronic device and computer-readable storage medium
WO2012091360A2 (ko) 유저 맞춤형 컨텐츠 제공 방법 및 시스템
WO2013176365A1 (en) Method and electronic device for easily searching for voice record
WO2012134180A2 (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
EP3403415A1 (en) Method and device for accelerated playback, transmission and storage of media files
WO2013176366A1 (en) Method and electronic device for easy search during voice record
WO2017142127A1 (ko) 단어/숙어 시험 문제 출제 방법, 서버 및 컴퓨터 프로그램
WO2011137724A1 (zh) 基于语义逻辑的类自然语言人机对话装置
WO2021137637A1 (en) Server, client device, and operation methods thereof for training natural language understanding model
WO2012130145A1 (zh) 获取和搜索相关知识信息的方法及装置
WO2015129989A1 (ko) 콘텐츠 및 음원 추천 장치 및 방법
WO2020197257A1 (ko) 가시적 표현 요소를 이용한 번역 방법 및 그 장치
WO2011155736A2 (ko) 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980150114.1

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09832151

Country of ref document: EP

Kind code of ref document: A2

WWE Wipo information: entry into national phase

Ref document number: 13139118

Country of ref document: US

Ref document number: 2011540611

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 4112/CHENP/2011

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09832151

Country of ref document: EP

Kind code of ref document: A2