CN102246164B - 基于用户意图的信息搜索方法以及信息提供方法 - Google Patents
基于用户意图的信息搜索方法以及信息提供方法 Download PDFInfo
- Publication number
- CN102246164B CN102246164B CN200980150114.1A CN200980150114A CN102246164B CN 102246164 B CN102246164 B CN 102246164B CN 200980150114 A CN200980150114 A CN 200980150114A CN 102246164 B CN102246164 B CN 102246164B
- Authority
- CN
- China
- Prior art keywords
- information
- search
- intention
- metadata
- editing machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
提供了基于用户意图的信息搜索方法以及信息供应方法。所述信息搜索方法包括:通过使用对被搜索的关键字的分析结果,来提供与所确认的搜索者的意图相匹配的编辑装置;以及,对具有与通过该编辑装置输入的元数据相关的元数据的内容进行搜索。以此方式,可根据搜索者输入的信息来确认搜索者的意图,可基于所确认的意图来导出详细元数据,并可通过使用输入的元数据来执行搜索。
Description
技术领域
本发明涉及能够基于自然语言的作为关键字的单词、短语以及句子来提供并搜索信息以及能够基于用户的意图来更为精确地提供并搜索信息的多功能搜索方法及***。
背景技术
近年来,开发对信息及内容提供者、消费者的扩大以及各种信息提供媒体进行融合的技术的需求正在加大。典型的融合技术的示例可包括对有线和无线广播及通信技术、综合信息网络服务技术以及便于各个用户层的用户接口技术开发进行融合的融合技术。在该技术的详细内容中,期望开发信息市场技术,以满足信息内容的用户的口味和意图,并通过自动分析特性以及对所提供的内容及信息或将由计算机提供的内容及信息进行语意分析,通过方便和不同的方法来建议和提供信息内容。
例如,公开号为10-2006-0043333的韩国专利申请(SYSTEM AND METHOD FORDETERMINING INTENTION OF DATA AND RESPONDING TO DATA BASED ON INTENTION)公开了一种便于数据处理的***。该***是包括数据管理器和用于接收数据的组件的***,所述数据管理器用于确定所述数据的意图、基于该意图来至少对数据子集进行重新***化以及将重新***化后的数据自动提供给用户。该数据管理器为用于分析所述数据、将所述数据分类成具有相关特征的至少一个组、从至少一个数据组中提取特征以形成数据子集的***。可选地,所述数据管理器是使用元数据、属性、内容、上下文、关键字、历史、试探法、推理、规则、划分(damarcation)、时间、日期、相关处理成本、相关处理收益以及数据源中的至少一者来促成数据分析的***,其中至少部分地基于语法结构、语法属性、语言结构以及语言属性来提取所述特征。所述语言特征是包括根据句子生成的单词、根据句子生成的双单词(word bigram)以及根据句子生成的三单词(word trigram)中的至少一者的***。
公开号为2002-0028593的韩国专利申请(METHOD FOR ISOLATING HARMFUL WORD)公开了一种用于隔离有害单词(harmful word)的方法,该方法包括:允许计算机用户输入会员信息并访问管理服务器,允许计算机用户输入用于注册/传送的信息至所述管理服务器所显示的信息输入屏幕,允许用于将有害单词与管理服务器相隔离的模块确定有害单词是否包含在计算机用户输入的信息中,以及允许管理服务器根据用于隔离有害单词的模块的判断结果来隔离与计算机用户的连接或注册/传送信息。假定所述有害单词指的是行话(jargon)、俚语、涉及性隔离或性格隔离的单词,则公开号为2002-0028593的韩国专利申请包括在所传送的消息不包括这些有害单词时连续执行聊天的处理模块。公开号为的2002-0028593的韩国专利申请是以聊天中的消息是否包括有害单词为基础的。
公开号为10-2006-0062300的韩国专利申请(MULTISTAGE TEXT FILTERINGMETHOD FOR ISOLATING HARMFUL SITE)公开了一种用于隔离有害站点的多级文本过滤方法,该方法包括:根据淫秽程度及文本将要被用作用于隔离色情站点的数据的所述文本划分为至少一个组,之后对所述文本进行数据库处理;从访问网站收集所述文本;以及通过将所述文本与所述组内的文本进行比较以确定所述访问网站是否被隔离,来执行至少一个多级过滤,从而根据所述文本中的淫秽程度对有害站点进行隔离。
公开号为10-2006-0062300的韩国专利申请(A SYSTEM AND METHOD FORPROVIDING IMPROVED SPAM MESSAGE FILTERING)公开了一种用于提供垃圾消息过滤的方法,该方法包括:无线网络服务器接收将从呼叫方终端传送到用户终端的消息;语料库DB存储自然语言句子及其附属信息的使用示例,且为大型语言DB(数据库);词汇分析单元检测所述无线网络服务器内的消息的接收,并从包含在接收到的消息中的句子中提取至少一个名词型关键字;语料库搜索装置选择被提取的名词型关键字中的至少一个名词型关键字,并搜索在包含在所述语料库DB的每个用户类别中的每个句子内的垃圾信息使用频率以及在包含在用户类别之外的类别中的句子中的基本使用频率;当至少一个垃圾信息使用频率以及基本使用频率被输入时,概率计算单元计算包含所选名词型关键字的句子被包含于用户类别中的概率;以及过滤控制器控制所述词汇分析单元和语料库搜索装置以使得所述概率计算单元计算每一名词型关键字被包含于垃圾消息内的概率,判断接收到的消息是否为垃圾消息,并将判断结果传送至无线电网络服务器。
公开号为10-2008-0000416的韩国专利申请(FILTERING SYSTEM FOR HARMFULMES SAGE AND METHOD THEREOF AND RECORDING MEDIUM THEREOF)公开了一种利用用于对网络社区上的有害消息进行过滤的过滤***来对有害消息进行分类的技术领域。该专利申请提供的方法能够通过提供智能垃圾过滤技术,来在反垃圾市场内实现高的适销性。针对有害消息的过滤***包括:数据库,用于存储接收自客户端的消息;消息接收器,用于接收所述消息;单词提取单元,用于从接收到的消息中提取多个单词;以及评估单元,用于通过使用所提取的单词来判断所述消息是否有害,并将其存储于数据库中,并且所述评估单元使用存储在所述数据库中的单词评估值来判断所述消息是否为有害消息,之后该消息被分类为多个有害消息。
注册号为10-0484944的韩国专利(SYSTEM FOR AUTOMATICALLY TAGGINGSEMANTICS OF MORPHEME BASED ON LOCAL SYNTAX RELATION AND SEMANTIC CO-OCCURRENCE DICTIONARY)公开了一种基于本地短语关系以及语义共现(cooccurrence)目录的自动语素语义标记***,该***包括:短句识别器,用于通过使用基本语法生成规则、从属语法规则、电子语素语意目录、语义框架以及经由对原始句子的语素分析生成的可变格短语共现目录,来对短句进行识别;助词格恢复模块,用于通过使用语义框架以及可变格短语语义共现目录,来执行针对助词的格恢复;争议名词(argument noun)语意确定模块,用于通过使用可变格短语语义共现目录来确定争议名词的语意;名词短语语意确定模块,用于通过使用名词短语语意共现目录(由名词/介词/名词以及名词/名词共现信息配置而成)来确定名词短语和复合名词内的名词的语意。自动语素语义标记***使用语言方面的语法结构信息来使用语法上下文信息(其是比现有的其他语义歧义装置更为精确的共现信息),从而提出了一种用于解决名词的语意歧义的方法。
注册号为10-0757951的韩国专利(SEARCH METHOD USING MORPHEME ANALYZINGIN WEB PAGE)公开了一种通过对网页进行语素分析的搜索方法,该方法包括:如果客户端用户通过分页式浏览器(tab browser)连接至网站,则将所连接的网站的内容显示给该分页式浏览器;通过由分析服务器对显示至客户端的分页式浏览器的内容执行上下文语素分析,来辨别重复句子或单词的频率;从被识别的单词中选择具有预定频率值或更高频率值的句子及单词作为关键字(即,很重要的单词);输出所选的重要单词作为每一分页式浏览器的标题;对将每一分页式浏览器的标题作为入口网站的查询字进行搜索,并将搜索结果作为每一分页式浏览器的内容进行输出;在分析服务器中,提供信息至客户端(诸如,笔记本、移动电话、PDA等)。该专利利用搜索***的一种方法论,通过语素处理,来计算句子及单词出现于文本内的次数,将分页式浏览器标题作为关键字进行输出。
注册号为10-0691400的韩国专利(METHOD FOR ANALYZING MORPHEME USINGADDITIONAL INFORMATION AND MORPHEME ANALYZER FOR EXECUTING THE METHOD)公开了一种用于分析语素的方法,该方法包括:从索引数据中获取语素分析对象以及与该语素分析对象相关联的附加信息;基于该附加信息,生成关键点(key);以及使用该关键点对语素分析对象执行语素分析。
公开号为10-2007-0029389的韩国专利申请(METHOD AND SYSTEM FOR PROVIDINGADVERTISEMENT SERVICE USING CORE KEYWORD AND RECORD MEDIA RECORDED PROGRAMFOR REALIZING THE SAME)公开了一种记录介质,该记录介质可由数字处理装置读取,且其上实施有命令字,该命令字可由数字处理装置执行以通过使用核心关键字来提供关键字广告服务,包括:通过分析内容文本的语素来提取关键字;通过与广告关键字DB服务器进行交互,确定核心关键字;通过与广告DB服务器进行交互,接收与所述核心关键字相匹配的广告列表;以及将包含于该广告列表内的至少一广告***至所述内容文本中。
公开号为10-2006-0011333的韩国专利申请(SYSTEM AND METHOD FOR PROVIDINGLOCAL INFORMATION BY MESSAGE ANALYSIS)公开了一种用于提供本地信息的***,该***包括:数据库,用于存储每一区域及商业类型的广告信息;消息识别单元,用于分析存储的短消息或存储的文本消息;语音识别单元,用于分析存储的语音消息;位置信息收集单元,用于检查订阅者终端的当前位置;服务控制器,用于向消息识别单元及语音识别单元请求与服务订阅者相关的消息是否已被存储,检查接收到的消息分析结果,向位置信息收集单元请求订阅者终端的当前位置信息,以及根据消息分析结果向订阅者终端提供期望的商业类型及区域信息;以及SMS生成单元,用于从数据库搜索信息,将搜索结果添加至短消息中,并将其传送至订阅者终端。
公开号为10-2007-0015752的韩国专利申请(SYSTEM AND METHOD FOR ADTRIGGERING MESSAGING SERVICE BASED ON MOBILE MESSAGING SERVICE)公开了一种用于AD触发消息服务的***,该***包括:消息服务器,用于在通过对传送自呼叫方终端的消息进行分析而检测到AD触发标识符时,在将预定AD消息传送至呼叫方终端之后,传送消息内容至接收终端。
注册号为10-0775680的韩国专利(METHOD AND SYSTEM FOR PROVIDINGADVERTISEMENT CONTENTS BY USING CHATTING IN MOBILE TERMINAL)公开了一种用于通过无线通信网络来在移动通信终端与服务器之间通过messager(一种聊天软件)收发消息的方法,该方法包括:判断连接至服务器的移动通信终端是否从聊天伙伴中选择任何虚拟聊天伙伴;根据移动通信终端的用户偏好信息来在服务器中提取AD内容产品的聊天场景,以根据场景规则来将消息传送至移动通信终端;传送移动通信终端中的针对所述服务器的消息的响应消息;对在服务器内接收到的移动通信终端的消息进行分析,并根据用户的意图以及场景规则来传送请求AD内容信息推荐许可的消息至移动通信终端;当从所述移动通信终端向服务器传送允许AD内容信息推荐的消息时,传送AD内容信息至移动通信终端;以及在服务器内,在传送消息至移动通信终端之前,通过对移动通信终端的消息进行分析,来将messager的特征状态调整成与用户的意图相对应。
注册号为10-0597435的韩国专利(SYSTEM AND METHOD FOR CLASSIFYINGQUESTION BASED ON HYBRID OF INFORMATION SEARCH AND QUESTION ANSWER SYSTEM)公开了一种基于信息搜索及问答***的混合来对问题进行分类的***及方法,其包括:被问化名(questioned work name)处理器,用于识别包含于所输入问题内的化名;问题语言分析器,用于通过语素分析过程、对象名称识别过程以及单词语意标记过程,来将每一单词转换为语义代码;基于规则的问题分类器,用于通过使用问题的LSP(词汇语法模式)代码以及预定义问题分类规则,来对问题所请求的答案类型进行分类;基于统计的问题分类器,用于通过使用在标记答案类型的学习文档中构建的统计信息,来对问题的LSP代码进行分类;以及被问答案类型确定器,用于通过使用上述两个分类器的结果,来最终确定用户问题的答案类型。
注册号为10-0361166的韩国专利(SYSTEM AND METHOD FOR SEARCHINGINFORMATION)公开了一种用于搜索信息的***及方法,其包括处理装置,该处理装置在数据库(该数据库根据领域来对多个信息进行分类,将代码分配至每一分类领域,并结合每一领域的代码来对表示包含于相应领域内的多个信息的单词进行编码)通过使用通信装置、经由网络访问用户搜索数据之后,当输入表明待搜索的信息或相应信息所属的领域的单词时,对输入单词进行编码,并基于编码后的单词来对数据库进行搜索以搜索与该编码单词相对应的信息。其中存储于数据库内的信息被分类为多个信息区,每一信息区被分配有信息分类代码,该信息分类代码被分类至至少一个详细信息区中,结合相应信息区的信息分类代码来对该详细信息区进行编码,表示相应信息的多个单词内相互之间具有相同或类似语意的单词由同一代码进行存储,以系序(set order)来对每一字代码进行排列。
公开号为10-2005-0092955的韩国专利申请(SYSTEM AND METHOD FOR ONLINE ADINCLUDING COPY OF ADVERTISER FIT FOR CONTENTS)公开了一种用于进行在线广告的***及方法,其包括:第一存储装置,用于存储将被广告的信息;第二存储装置,用于存储原始内容;至少一个服务器,用于从所述第二存储装置获取原始内容,通过自然语言处理机制对该原始内容进行分析,从所述第一存储装置获取与分析结果相对应的将被广告的信息,并将广告信息中的词性(part)信息***所述原始内容中;以及第三存储装置,用于通过所述至少一个服务器来对插有广告信息的内容进行存储。
注册号为10-0669534的韩国专利(METHOD AND SYSTEM FOR EXTRACTING SUMMARYOF DOCUMENT BY UTILIZING SENTENCE ABSTRACTION AND ABDUCTION RULES)公开了一种通过使用句子抽象及逆推规则来对文档进行概括的方法,其包括:句子输入,用于输入并存储将被概括的文档内容;语法分析,用于对所述步骤内存储的数据的语法进行分析并存储;句子主要成分提取,用于在该步骤处顺序读取语法数据,并存储本体数据;句子抽象化,用于通过将所述步骤处的本体数据值与识别上限信息(该识别上限信息为针对包含于每一所选主要成分内的语意的预定分类参考)进行比较,将每一所选主要成分理解为抽象语意;主题句选择,用于在所述步骤处读取被存储的值,并将读取的存储值输入至逆推规则程序可移动装置单元中,以选择语法之间具有逆推性的多个主题句,并存储该多个所选主题句的每一识别值;概要写入,用于在所述步骤处读取针对被存储并被选择的主要成分而理解的抽象语意的相应值,并将读取的值作为语法概要句子进行组合和存储;概要句子输出,用于确定是否存在输出控制信号,如果存在,则在该步骤处通过输出单元的操作来输出并显示存储的数据值。
注册号为10-0836878的韩国专利(APPARATUS AND METHOD FOR ALLOCATION OFSUBJECT OR FIELD IN INFORMATION SEARCH SYSTEM)是用于在信息搜索***内分配主题或字段的设备,所述信息搜索***连接至用户终端、网络入口站点、网站,对信息进行搜索并提供搜索到的信息,信息搜索服务器包括:搜索引擎,用于基于与查询字或文档相对应的索引字来对文档执行信息搜索;数据库,用于对搜索引擎搜索到的信息进行存储和管理;同义词匹配单元,用于从存储于所述数据库内的原始句子中提取所述索引字,并通过该索引字执行同义词匹配,以对所述原始句子执行主题或域分配;分众分类(folksonomy)处理器,用于从存储于所述数据库内的定义句子中提取术语,通过提取的术语来分配所述主题并使用分众分类法来分配域。
此外,大型信息搜索门户网站(诸如,谷歌、雅虎等)所使用的信息搜索***是以搜索键类型的“单词”单元为基础的。虽然可执行“短语”输入,但当前技术通过逻辑运算符(与、或、非)而非通过根据高技术“短语”的语言处理方法来连接基于N元语法的索引键,以给出搜索结果,从而在改善信息搜索的再生及精确性方面存在局限性。特别地,“移动信息搜索”技术已作为下一代信息搜索领域而崭露头角,并且正在提出并讨论作为“语义网”技术飞新的网络搜索技术。然而,截至目前为止,并不存在具体的成功示例。
发明内容
本发明被设计为解决上述问题。本发明的目标为提供用于搜索多功能综合信息(integration information)的方法及***,该方法及***能够通过将单词单元用作关键字来扩展信息搜索***内的短语单元及句子单元内的搜索键,以使信息搜索***的用户界面更为便利,并且能够执行多功能综合处理(诸如信息的供应、搜索、分类、评估、监视等)。
此外,本发明的另一目标为提供一种用于搜索多功能综合信息的方法及***,该方法及***能够检测信息搜索者或信息提供者的意图,并基于检测到的意图来提供信息结果。
为实现上述目标,根据本发明的示例性实施方式,提供一种用于搜索信息的方法,该方法包括:通过使用针对关键字的分析结果来检测搜索者的意图;向所述搜索者提供符合所述搜索者的意图的编辑器;以及对具有与通过所述编辑器的输入项输入的元数据相关联的内容进行搜索。
所述用于搜索信息的方法可进一步包括:将输入的关键字分离为语意单词;以及对分离后的关键字执行语法分析,其中,对搜索者的意图进行检测可以通过使用执行所述语法分析时的语法分析结果来检测搜索者的意图。
所述语法分析的执行可以输出语法表达式来作为语法分析结果,其中,可以通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
所述语法表达式可为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
所述语法分析的执行可参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,且所述语法文法规则字典可列有短语结构文法、格文法、敏感文法(sensitive grammar)以及词汇文法中的至少一者。
所述分离可针对每个词性(part)来对所述关键字进行分离。
所述分离可通过参考与每个单词的词性相关的信息来针对每个词性对所述关键字进行分离,所述信息以数据库方式存储于语素字典内。
所述用于搜索信息的方法可进一步包括提取内容的符合搜索者意图的元数据,其中所述编辑器的提供可提供作为符合搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
所述用于搜索信息的方法可进一步包括通过参考信息提供者的意图来确定用于执行搜索的目录,其中所述搜索可对与所确定的目录相同或相似的目录中的内容进行搜索。
所述关键字可为单词单元、短语单元以及句子单元中的任一者。
所述搜索可对具有与通过所述编辑器的输入项输入的元数据中的至少一者相同的元数据、或具有与通过所述编辑器的输入项输入的元数据中的至少一者同义的元数据的内容进行搜索。
所述用于搜索信息的方法可进一步包括在搜索时将附加服务添加至搜索结果。
所述附加服务可为内容上下文认知服务,并且该内容上下文认知服务可包括以下各项中的至少一者:导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务以及行政服务(administrative service)。
所述编辑器的输入项中的至少一个输入项可以作为通过使用所述关键字生成的实际数据(real data)而被自动输入。
所述用于搜索信息的方法可进一步包括通过将输入的元数据与用于配置被搜索内容的元数据进行比较,来分别选择并输出具有高度一致性的内容。
根据本发明另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括:通过使用针对包含于信息内的文本的分析结果,来检测提供所述信息的信息提供者的意图;将符合所述信息提供者的意图的编辑器提供给用户;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。
所述提供用于搜索的信息的方法可进一步包括:将包含于输入信息内的文本分离成语意单词;以及对分离后的关键字执行语法分析,其中对信息提供者的意图进行检测可以通过使用执行所述语法分析时的语法分析结果来检测提供信息的信息提供者的意图。
所述语法分析的执行可以输出语法表达式来作为语法分析结果,其中,可以通过分析句子内分离后的单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
所述语法表达式可为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
所述语法分析的执行可参考语法文法规则字典,以分析句子内分离后的单词是否具有任何文法关系以及语义关联,且所述语法文法规则字典可列有短语结构文法、格文法、敏感文法以及词汇文法中的至少一者。
所述分离可针对每个词性来对所述文本进行分离。
所述分离可通过参考与每个单词的词性相关的信息来将针对每个词性对所述文本进行分离,所述信息以数据库方式存储于语素字典内。
所述提供用于搜索的信息的方法可进一步包括提取内容的符合信息提供者的意图的元数据,其中所述编辑器的提供可提供作为符合信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
所述提供用于搜索的信息的方法可进一步包括通过参考信息提供者的意图来确定存储所述信息的目录,其中内容的存储可以将所述内容存储于所确定的目录内。
所述提供用于搜索的信息的方法可进一步包括对包含于针对每一目录划分的内容内的文本进行收集,其中所述检测可使用对收集到的文本的分析结果。
根据本发明的另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括:对包含于针对每一目录划分的内容内的文本进行收集;通过使用针对收集到的文本的分析结果,来检测提供信息的信息提供者的意图;将符合信息提供者的意图的编辑器提供给用户;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。
根据本发明的另一示例性实施方式,提供一种用于搜索信息的方法,该方法包括:接收关键字;接收输入所述关键字的搜索者的意图;将符合最终意图的编辑器提供给所述搜索者,所述最终意图整合了针对所述关键字的分析结果以及所述搜索者的意图;以及对具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容进行搜索。
所述用于搜索信息的方法可进一步包括:将输入的关键字分离成语意单词;以及对分离后的关键字执行语法分析,其中所述编辑器的提供可使用执行所述语法分析时的语法分析结果。
根据本发明的另一示例性实施方式,提供一种提供用于搜索的信息的方法,该方法包括:接收信息;接收输入所述信息的信息提供者的意图;将符合最终意图的编辑器提供给所述信息提供者,所述最终意图整合了针对所述信息的分析结果以及所述信息提供者的意图;以及将对通过所述编辑器的输入项输入的元数据进行整合的内容进行存储。
所述提供用于搜索的信息的方法可进一步包括:将输入的信息分离成语意单词;以及对分离后的单词执行语法分析,其中所述编辑器的提供可以使用执行所述语法分析时的语法分析结果。
如上所述,与现有的将“搜索单词”用作关键字,并通过将逻辑运算符与、或和非的组合用作所述关键字的扩展来搜索其他搜索单词的搜索方法相比,本发明的示例性实施方式可执行“短语”及“句子”级别的搜索,实现了信息的再现性及精确性。
进一步地,本发明的示例性实施方式可根据提供者的意图来针对每一目录对信息提供者所提供的信息进行分类及存储,并通过检测信息搜索者的搜索意图来对存储于相应目录内的信息进行搜索,从而通过上下文认知信息供应/搜索提供了经双方同意的/定制的搜索服务。
另外,本发明的示例性实施方式还针对每一内容来定义不同的元数据,并采用通过使用基于该元数据生成的编辑器来更为详细地对信息供应及搜索内容进行开发的方法,从而相比于现有的搜索方法,能够更为方便且精确地执行搜索。
此外,本发明的示例性实施方式从搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入以及使用输入的元数据,从而在符合搜索者意图的目录里执行搜索。
进一步地,在本发明的示例性实施方式中,信息提供者或搜索者可更为方便地输入元数据,并可在输入哪种类型的元数据方面接收引导,从而提高了输入的方便性。
另外,本发明的示例性实施方式可以基于信息提供者的意图来对针对每一目录的相应信息进行划分,且可以对相应的元数据进行匹配和存储。
同时,本发明的示例性实施方式可从搜索者输入的信息来检测搜索者的意图,并基于检测到的意图来推导详细元数据的输入,从而可自动输入生成实际数据的元数据。
进一步地,本发明的示例性实施方式可直接输入信息提供者及信息搜索者的意图,以更为精确地检测信息提供者及信息搜索者的意图,从而精确地提供并搜索信息。
另外,本发明的示例性实施方式可通过使用PC或移动电话等来将候选人的宣传资料发布给投票者,从而可通过使用目前使用成本很低的宣传纸来迅速地提供候选人的宣传资料。
附图说明
图1为示出了根据本发明示例性实施方式的搜索***的图示;
图2为示出了内容的元数据的图示;
图3为示出了韩文语素字典的图示;
图4为用于对将短语/句子处理成语素并之后执行语法分析的过程进行解释的图示;
图5为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图;
图6为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图;
图7为用于对地理导航服务进行解释的图示,该地理导航服务作为存储于附加服务数据库内且生成自附加服务生成器的附加服务的示例,并且是一种上下文认知搜索服务;
图8为用于对提供不同于图7所示类型的附加服务的方法进行解释的图示;
图9为示出了将信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的图示;
图10为示出了根据本发明另一示例性实施方式的搜索***的图示;
图11和图12为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示;
图13为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示;
图14-图16为用于对图13所示的搜索方法进行附加解释的图示;
图17为示出了根据本发明另一示例性实施方式的搜索***的图示;
图18为用于对根据本发明另一示例性实施方式的搜索***进行解释的图示;
图19为用于对根据本发明另一示例性实施方式的搜索***进行解释的图示;
图20为示出了应用于宣传候选人以进行电子投票的示例的图示。
参考标记及符号说明
101:信息搜索窗口
102:关键字输入装置
103:关键字语素处理器
104:关键字语法分析器
105:搜索者意图检测器
106:信息监视器
107:用于搜索的元数据提取器
108:用于搜索的编辑器
109:搜索目录确定装置
110:搜索装置
111:元数据比较器
112:附加服务数据库
113:附加服务生成器
114:搜索结果生成器
115:信息存储单元
116:存储目录确定装置
117:信息提供编辑器
118:信息提供元数据提取器
119:元数据DB
120:信息提供者意图检测器
121:信息监视器
122:信息语法分析器
123:语法文法规则字典
124:信息语素处理器
125:语素字典
126:信息输入装置
127:信息提供窗口
128:信息数据库
129:搜索结果显示单元
1001:信息搜索窗口
1002:关键字输入装置
1003:关键字语素处理器
1004:关键字语法分析器
1005:搜索者意图检测器
1006:信息监视器
1007:用于搜索的元数据提取器
1008:用于搜索的编辑器
1009:搜索装置
1010:元数据比较器
1011:附加服务数据库
1012:附加服务生成器
1013:搜索结果生成器
1014:信息存储装置
1015:信息提供编辑器
1016:信息提供元数据提取器
1017:元数据DB
1018:内容提供者意图检测器
1019:信息监视器
1020:语法分析器
1021:语法文法规则字典
1022:语素处理器
1023:语素字典
1024:目录内容搜索器
1025:信息DB
1026:搜索结果显示装置
1027:搜索目录确定装置
1028:存储目录确定装置
1701:信息提供/搜索窗口
1702:语素处理器
1703:语素字典
1704:语法分析器
1705:语法文法规则字典
1706:意图指定器
1707:信息监视器
1708:信息提供元数据提取器
1709:信息提供编辑器
1710:存储目录确定装置
1711:信息存储装置
1712:信息DB
1714:用于搜索的元数据提取器
1715:用于搜索的编辑器
1716:搜索目录确定装置
1717:搜索装置
1718:元数据比较器
1719:搜索结果生成器
1720:搜索结果显示装置
1721:附加服务DB
1722:附加服务生成器
具体实施方式
下文中,将参考附图对本发明的示例性实施方式进行描述。
图1示出了根据本发明示例性实施方式的搜索***。构成根据本发明示例性实施方式的搜索***的块可通过S/W及H/W来实现。此外,构成所述搜索***的一些块可通过S/W来实现,而其余的块则可通过H/W来实现。
根据本发明示例性实施方式的搜索***通过上下文认知信息供应/搜索来提供经双方同意的/定制的搜索服务,该服务根据提供者的意图、针对每一目录来对信息提供者提供的信息进行分类和存储,并通过检测信息搜索者的搜索意图来对存储于相应目录内的信息执行搜索。
此外,本发明的示例性实施方式还针对每一内容来定义不同的元数据,并采用通过使用基于该元数据生成的编辑器来更为详细地对信息供应及搜索内容进行开发的方法,从而相比于现有的搜索方法,能够更为方便且精确地执行搜索。
在此情况下,所述元数据可为可详细且***地定义内容的特征(其为信息供应/搜索的对象)的数据。
例如,“书籍”的元数据指有关书籍的详细信息,诸如书籍名称、作者、出版社、出版年限、价格、主题等。
在本发明的示例性实施方式中,可通过具有已定义框架的编辑器来对所述元数据进行输入及确认。可通过表格格式或句子格式来实施所述框架格式。
图2为示出了内容的元数据的图示。如图2所示,可以确认,已对所有领域的内容的必要的元数据进行了定义。
例如,可以确认,在不动产交易202中,将“销售物品”、“位置”“预期价格”、“特征”、“地铁信息”和“视频信息”等标准化为元数据。
图2所示的内容的元数据存储于图1所示的元数据DB 119中。
同时,如图1所示,根据示例性实施方式的搜索***包括:信息搜索窗口101、关键字输入装置102、关键字语素处理器103、关键字语法分析器104、搜索者意图检测器105、信息监视器106、用于搜索的元数据提取器107、用于搜索的编辑器108、搜索目录确定装置109、搜索装置110、元数据比较器111、附加服务数据库112、附加服务生成器113、搜索结果生成器114、信息存储装置1115、存储目录确定装置116、信息提供编辑器117、信息提供元数据提取器118、元数据DB 119、信息提供者意图检测器120、信息监视器121、信息语法分析器122、语法文法规则字典123、信息语素处理器124、语素字典125、信息输入装置126、信息提供窗口127、信息DB 128以及搜索结果显示装置129。
信息输入装置126将用户通过信息提供窗口127输入的信息传输至信息语素处理器124。
语素字典125以数据库方式对每个单词的词性信息进行存储。此外,语素字典125对每一单词的扩展信息、同义词信息或外文翻译扩展信息等以数据库方式进行存储。在此情况下,由于对登记于语素字典125内的单词不存在限制,所以还可在该语素字典125内登记其他词性信息(part information)(代词、形容词、后置词或结尾等)。
可参考登记于语素字典125内的词性信息来将针对每个词性对文本进行分离,且可使用语义信息来理解内容作者或搜素者的意图。此外,可使用同义词信息来在更宽范围内执行扩展搜索,且可使用外文翻译来执行多语言搜索。
图3示出了登记于语素字典125内的信息,且下面将参考图3对语素字典125进行详细描述。
信息语素处理器124以“语义单词”为单元对传输自信息输入装置126的文本进行分离。在此情况下,所述“语义单词”指一个词性。从而,可以理解的是,信息语素处理器124针对每个词性来将文本进行分离。
为此目的,信息语素处理器124通过参考语素字典125内以数据库方式存储的单词的词性信息,来针对每个词性将文本进行分离。
信息语法分析器122基于信息语素处理器124的语素处理结果,对用户输入的信息执行语法分析。该信息语法分析器122在执行语法分析的同时参考语法文法规则字典123内登记的文法规则。
信息提供者意图检测器120使用输出自信息语法分析器122的语法分析结果来检测信息提供者的意图。
信息监视器121对信息提供者意图检测器120检测到的信息提供者的意图进行输出,以使得用户可见。为此目的,该信息监视器121可使用图形化工具。
信息提供元数据提取器118从元数据DB 119中提取符合信息提供者意图检测器120检测到的信息提供者意图的内容的元数据。
信息提供编辑器117生成编辑器(其中,信息提供元数据提取器118提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。
存储目录确定装置116确定信息DB 128上适于存储所述内容的目录。在此情况下,存储目录确定装置116可通过参考信息提供者意图检测器120检测到的信息提供者的意图来确定所述目录。
信息存储装置115将整合了信息提供编辑器117所生成的元数据的内容存储于信息DB 128内。
在此情况下,该内容存储于由存储目录确定装置116所确定的目录内。
上述组件为用于生成并存储提供所述信息所必须的信息的组件。在下文中,将对当信息搜索者通过输入关键字来请求进行搜索时可通过推导通过搜索意图检测而输入的详细关键字来更为精确地执行搜索的组件进行详细描述。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。
信息搜索窗口101提供输入窗口,用户可通过该窗口输入关键字,诸如单词、短语或句子。进一步地,关键字输入装置102将用户通过信息搜索窗口101输入的关键字传输至关键字语素处理器103。
关键字语素处理器103以“语义单词”为单元对传输自关键字输入装置102的关键字进行分离。在此情况下,所述“语义单词”指一个词性。从而,可以理解的是,关键字语素处理器103以类似于信息语素处理器124的方式来针对每个词性将关键字进行分离。
为此目的,关键字语素处理器103通过参考语素字典125内以数据库方式存储的单词的词性信息,针对每个词性将文本进行分离。
关键字语法分析器104基于关键字语素处理器103的语素处理结果,对搜索者输入的关键字执行语法分析。该关键字语法分析器104在执行语法分析的同时,参考语法文法规则字典123。
搜索者意图检测器105使用输出自关键字语法分析器104的语法分析结果来检测搜索者的意图。
信息监视器106对搜索者意图检测器105检测到的搜索者意图进行输出,以使得用户可见。为此目的,该信息监视器106可使用图形化工具。
用于搜索的元数据提取器107从元数据DB 119中提取符合信息搜索者意图检测器105检测到的搜索者意图的内容的元数据。
用于搜索的编辑器108生成编辑器(其中,用于搜索的元数据提取器108提取的元数据被形成为输入项),并将该编辑器提供给搜索者。
搜索目录确定装置109确定信息DB 128上适于搜索所述内容的目录。在此情况下,搜索目录确定装置109可通过搜索者意图检测器105检测到的搜索者的意图来确定所述目录。进一步地,搜索目录确定装置109可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
搜索装置110对信息DB 128内的具有与由用于搜索的编辑器108输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置109中所确定的目录内执行所述搜索。
搜索装置110可执行扩展搜索,该扩展搜索通过将用于搜索的编辑器108输入的元数据替换为同义词来执行所述搜索。
进一步地,搜索装置110可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之,搜索装置110还可执行相同搜索、部分搜索或相关搜索。
元数据比较器111将通过由用于搜索的编辑器108输入的元数据与构成由搜索装置110所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较来执行所述比较(确定所述一致性)。
附加服务数据库112可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的单元。
附加服务生成器113生成与所述关键字相关的附加服务。为此目的,附加服务生成器113使用存储于附加服务数据库112内的附加服务中的、适合于搜索者的搜索意图的附加服务。
附加服务数据库112及附加服务生成器113所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务、行政服务等。
搜索结果生成器114根据与输出自元数据比较器111的搜索结果(内容)的一致性,来添加附加服务生成器113所生成的附加服务。
搜索结果显示单元129通过屏幕输出从搜索结果生成器114生成的添加有附加服务的搜索结果,以将该结果提供给用户。
同时,可仅将与搜索结果一致的内容提供给用户,而不提供附加服务。这可以通过下面的方式来实现:附加服务生成器113不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器114亦不添加所生成的附加服务。
下文中,将参考图3,对上述语素字典125进行详细描述。图3示出了作为语素字典的示例的韩文语素字典。
如图3所示,语素字典125被配置成分别列有:1)第一列的韩文单词;2)第二列的单词词性信息;3)第三列的单词语义信息;4)第四列的一组同义词(或同意短语)、类似单词和/或代表单词;5)第五列的英文翻译;6)第六列的日文翻译;以及7)第七列的中文翻译。
通过使用图3所示的语素字典125,可允许信息语素处理器124将文本作为语素进行处理,并允许关键字语素处理器103将关键字作为语素进行处理。
如上所述,语素处理指的是给定句子的元素是否被配置为任何有意义的单词。例如,当将“(我去学校)”被作为语素进行处理时,划分单词界(例如,)即为语素处理。
在此情况下,所使用的信息(该信息为存储于语素字典125内的词性信息)审查各词性之间的关系,并输出诸如“/名词+/介词+/动词+/结尾”这样的关系作为处理结果。
进一步地,作为语素处理的附带信息,可获得诸如“单词频率”、“句子数量”之类的语言统计值,且可同时输出语义信息、同义词信息、外文翻译。
同时,可对登记于语素字典125内的语义信息进行如下分类:
1)名词实例
事情/自然/物质/元素/工具/装置/人际关系/社会/罪行/组织/文化/动物/人类/植物/数字/抽象/建筑/具体/行为/状态/时间/地点/位置/周期/频率/比率/等级/数量/重点/事实/情感/弊端/辱骂/政治/经济/公司名称/区域名称/思想/人名/食物/邪恶/医药用品等。
2)动词实例
行为/立即/继续/运动/改变/情感/思考/认知/存在/确定/意外/表达/服务等。
3)形容词实例
状态/关系/属性/等级/重点/好的感觉/不好的感觉/选择/邪恶/方面等。
4)介词实例
短语|装置/方法|原料/材料|起因/原因|源/起始点|原点/方向|对象/目标|结果|给出结束|接收结束|地点|时间|情况|内容|角色|对比|范围/频率|等级|数量|比率|重点|事实|方面等。
5)副词实例
|重点|等。
6)结尾表示方面的实例
过去|当前|未来|否定|可能性|亲密|义务|必需性|必然性|请求|需求|主张|确定估计|不确定估计/计划|希望|执行|命令|问题|忠诚|允许|邀请|工作|依赖|被动性|利益|谦虚|荣誉称号等。
然而,上述分类仅为示例,且可被改变。单词的语意时刻均在变化,从而可根据时间变化来改变语意分类,而非不变。进一步地,在对语义信息进行分类时,可参考根据同义词分类的词汇字典。
根据图3所示,
1)可以理解的是,“Syng Man lee 125-1”的词性信息为“名词”、语义信息为“人名”、以及同义词信息为“南韩总统”。
2)可以理解的是,“Naengmyeon 125-2”的词性信息为“名词”、语义信息为“食品名称”、以及同义词信息为“韩国的代表性面食”。
3)可以理解的是,“Carbon Dioxide 125-3”的词性信息为“名词”、语义信息为“有害物质”、以及同义词信息为“二氧化碳,全球变暖”。
4)可以理解的是,“Seyo 125-4”的词性信息为“结尾”、语义信息为“请求,尊敬”、以及同义词信息为“命令”。
5)可以理解的是,“Nom 125-5”的词性信息为“名词”、语义信息为“谦称”、以及同义词信息为“成员”。
可使用所述语义信息及同义词信息来扩大和扩展搜索。例如,当将“Syng Manlee”用作关键字时,还可提供针对“Syng Man lee”的搜索结果以及与“南韩总统”相关的搜索结果。
此外,当将“二氧化碳对策”用作关键字时,可进一步提供“有害物质”、“CO2对策”、“全球变暖对策”以及“二氧化碳对策”的搜索结果。
类似地,由于语义信息(诸如,“牛肉、猪肉、韩国泡菜”等)为“食物”且同义词信息为“肉”及“蔬菜”,所以可通过使用该语义信息及同义词信息来执行扩展搜索。
如上所述,可将词性信息、语义信息以及同义词信息登记于语素字典125内,从而可搜索丰富的信息。
下文中,将参考图3,进一步对通过处理短语/句子来对语法进行分析的过程进行描述。
所述语法分析为是分析构成句子的每一语意单词是否具有其他构成正确句子的结构的过程。可使用描述自然语言的文法理论来对语法进行分析。
描述自然语言的文法理论的示例可包括:短语结构文法、格文法、敏感文法或词汇文法等,这些对于文法描述方法而言均是不同的。
由于可将文法理论应用至所有语言(诸如英文、韩文、中文或日文等),还可将本实施方式所述的韩文语法分析方法应用至其他语言。
将经历图4所示的语素处理401过程的输入句子分离为语意单词单元,并将词性信息添加至每一分离后的单词402。该词性信息变为大约10-12个词性名称,诸如{名词,代词,数字,形容词,副词,介词,…}等。
为了分析每个单词相互之间如何耦合以形成正确的短语、从句以及句子,需要用于每种语言的正确短语、从句以及句子的生成规则403。该规则包含于上述语法文法规则字典123中,从而可从语法文法规则字典123中提取。
例如,当文法清楚地表达了“句子包括主题(名词短语)以及谓语(动词短语)”这一知识时,S(句子)可被表示为←NP(名词短语)·VP(动词短语)。用于短语、从句以及句子的生成规则403即为定义该规则之处。
简要描述这些规则:1)基于短语、从句以及句子中生成的规则,以单词为单位来定义短语结构文法类型;2)格文法类型及敏感文法类型以单词从句为单位来定义修饰单元与被修饰单元之间的关系;3)词汇文法类型采用VP=cat(动词,基础语意、…,Sub,SEM)类型,且通过被称之为联合的操作来执行各个单词之间的正确耦合。
作为具体示例,对短语结构文法规则及处理方法作如下定义:
(1)S←PPV
(2)PP←NP
当对“来自首尔”的语法进行分析时,生成语素处理结果的单词(首尔/N(名词),自/P(介词),来/V(动词)过去)。当执行短语分析时,由于“自首尔”为“NP”,故根据文法规则(2)将“自首尔”的语法分析为“PP(介词短语)”,且由于“来”为动词,故根据文法规则(1)将PP和V分析为“S(句子)”,从而就韩文而言,结果被输出为称之为(来(自首尔))的树状结构公式或列表结构公式。
同时,当根据敏感文法规则来对上述示例句子进行分析时,通过被称之为“自首尔→来”的表达式来输出语法分析关系,其中单词子句“自首尔”修饰单词子句“来”。
进一步地,词汇文法类型输出被称之为(来,[谁].[自首尔])的语法分析结果作为语义表达式。本发明可根据文法理论来输出语法分析表达式404中的每一者。因此,可输出根据词性信息的表达式405、根据语义信息的表达式406以及根据同义词/短语的表达式407。
图5示出了用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图。
如图5所示,当用户通过信息提供窗口127输入“(销售二手车)”时,信息输入装置126将用户输入的信息传输至信息语素处理器124(501)。
信息语素处理器124通过参考语素字典125来针对每个词性将“ (销售二手车)”进行分离,并将“销售二手车”输出为(502)。
在此情况下,根据语素处理结果,将词性信息及语义信息(名词/二手车,,动词/销售,结尾/尊敬)一起输出。在此情况下,所述词性信息为名词、动词以及结尾,而所述语义信息为二手车、销售以及尊敬。
之后,信息语法分析器122对语素处理结果执行语法分析,并输出结果(二手车→销售)(503)。
信息提供者意图检测器120使用输出自信息语法分析器122的语法分析结果来检测信息提供者的意图为“销售二手车”(504)。
因此,信息提供元数据提取器118从元数据DB 119中提取适于信息提供者意图的内容的元数据,即“(二手车交易)”(505)。
信息提供编辑器117生成编辑器(其中提取的元数据成为输入项),并将该编辑器提供给信息提供者(506)。最终,信息提供者通过提供的编辑器输入元数据(507)。
图5示出了这样一种情况,即将“二手车名称:索纳塔”、“变速箱:自动”、“年份:2001”、“行驶里程:100,000公里”、“颜色:银色”、“预期价格:1,200,000韩元”以及照片信息输入至具体项。
存储目录信息装置116确定信息DB 128上适于存储所述内容的目录,并添加目录索引键(二手车,销售)。这将在相应的目录内存储所述内容。同时,除了所述目录索引键(二手车,销售)之外,存储目录确定装置116还可添加用户ID(508)。
进一步地,信息存储装置115将整合了信息提供编辑器117所输入的元数据的内容存储于信息DB 128内。在此情况下,所述内容被存储于存储目录确定装置116所确定的目录内。
以上对根据信息提供者输入的信息来检测用户的意图并基于检测到的意图来推导将被存储为单个内容的详细元数据输入的过程进行了详细描述。
下文中,将参考图6对通过使用上述过程所存储的元数据来基于搜索者输入的关键字执行搜索的过程进行描述。
图6为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在该示例性实施方式中,当信息搜索者输入关键字时,可检测搜索者的搜索意图,且可以基于检测到的搜索者意图来进行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。
如图6所示,当用户通过信息搜索窗口首次输入关键字“(购买二手车)”(601)时,关键字语素处理器103针对每个词性来对输入的关键字进行分离,并在将其输出为(602)的同时,添加并输出词性信息及语义信息(即,名词/动词/结尾/尊敬)。
之后,信息语法分析器104基于语素处理结果来执行语法分析,并之后输出结果(二手车→购买)(603)。搜索者意图检测器105使用语法分析结果来检测搜索者的意图为“二手车→购买”(604)。
之后,用于搜索的元数据提取器107从元数据DB 119中提取适于搜索者的意图“购买二手车”的内容的元数据,且用于搜索的编辑器108生成编辑器(其中用于搜索的元数据提取器107提取的元数据为输入项),并将该编辑器提供给搜索者(605)。
结果,搜索者通过提供的编辑器来输入元数据(606)。图6示出了这样一种情况,即将“二手车名称:索纳塔”、“变速箱:自动”、“年份:2001年之后”、“行驶里程:低于100,000公里”、“颜色:银色”、“预期价格:1,200,000韩元或更低”以及“燃料:液化气”输入至具体项。
搜索目录确定装置109确定信息DB 128上适于搜索所述内容的目录,且搜索装置110在信息DB 128中搜索具有与由用于搜索的编辑器108输入的元数据相同的元数据的内容。在搜索目录确定装置109中确定的目录内执行所述搜索。
在此情况下,搜索目录确定装置109可通过参考搜索者意图检测器105检测到的搜索者意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。进一步地,搜索装置110还可执行相同搜索、部分搜索或相关搜索。
之后,元数据比较器111将通过用于搜索的编辑器108输入的元数据与构成搜索者110所搜索的内容的元数据进行比较(608)。进一步地,元数据比较器111基于比较结果来仅选择并输出具有高度一致性的内容。
到目前,详细描述了根据搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入以及通过使用输入的元数据来在符合搜索者意图的目录中执行所述搜索的过程。
本发明的示例性实施方式可被实施为通过使用常规或标准编辑器来输入元数据。因此,信息提供者或搜索者可更方便地输入元数据,并且可在输入哪种类型的元数据方面接收引导。因此,可增加输入的方便性。
通过使用常规编辑器来输入元数据的形式还可被应用至诸如移动电话或IPTV之类的装置的情形。
同时,本发明的示例性实施方式可执行条件搜索,该条件搜索可根据特定条件来限制特定元数据。例如,执行关键字为“120(1,200,000韩元或更低的二手车)”的搜索对应于所述条件搜索。
图7为用于对地理导航服务进行解释的图示,该地理导航服务作为存储于附加服务数据库112内且生成自附加服务生成器113的附加服务的示例,并且是一种上下文认知搜索服务。
为此目的,图7中假设通过信息搜索窗口101来输入句子“ (这附近是否有美味的意大利餐馆)”(701)。
语素处理器103以语素形式对输入句子701进行处理,并将其分离成(702),之后输出加入了语义信息的“/名词/当前位置,/形容词/食物评价,/介词/修饰,/名词/国名,/名词/餐馆,/介词/暗示”(703)。
之后,关键字语法分析器104对语素处理结果的语法进行分析,且搜索者意图检测器105通过语法分析结果来检测搜索者的意图。具体而言,搜索者意图检测器105分别指示上下文认知单词的语义信息为上下文认知单词被检测为具有“可以通过GPS确认的当前位置”的语意,且被检测为具有要求搜索餐馆数据库的意图。
因此,附加服务生成器113通过使用GPS来检测当前位置(704),搜索装置110执行对美味意大利餐馆的搜索(705),附加服务生成器113执行映射(706),并且指示地图(该地图上显示了当前位置)上被搜索到的美味意大利餐馆的地图被输出(707)。
图8为用于对提供不同类型的附加服务的方法进行解释的图示。图8所示的附加服务用于将与包含于文本输出中的特定单词及主题相关的各种附加信息提供作为搜索结果。为此目的,可使用存储于附加服务数据库112内的各种信息,诸如组织信息801、广告信息802、特性信息803、正题主题信息804或公司信息805等,且可以从通过网络相连的其他数据库中获取所述各种信息。
图9为示出了将信息搜索窗口及信息提供窗口提供在一起的信息提供/搜索窗口的示例的图示。所示信息提供/搜索窗口中的输入窗口901为用于输入关键字的窗口,信息提供按钮902为在信息被提供/登记输入至输入窗口901时使用的按钮,信息搜索按钮903为用于命令对输入至输入窗口901的关键字进行信息搜索的按钮。
进一步地,提供于底部的按钮904用于设置搜索方法及提供搜索结果的方法。例如,图9中给出的“完整搜索”按钮用于将搜索类型设置为完整搜索,“广告许可”按钮用于允许将与搜索结果相关的广告与搜索结果一起显示,“相关服务提供许可”按钮用于允许在包含于搜索结果内的单词及短语上一起提供附加信息。
还可将图7-9中所给出的实施示例应用于将在以下进行描述的其他示例性实施方式,因此,将在以下进行描述的示例性实施方式将不再重复地描述以上实施的示例。
图10为示出了根据本发明另一示例性实施方式的搜索***的图示。构成根据本发明示例性实施方式的搜索***的块可通过S/W及H/W来实现。此外,构成所述搜索***的一些块可通过S/W来实现,而其余的块则可通过H/W来实现。
如图10所示,根据本示例性实施方式的搜索***包括:信息搜索窗口1001、关键字输入装置1002、关键字语素处理器1003、关键字语法分析器1004、搜索者意图检测器1005、信息监视器1006、用于搜索的元数据提取器1007、用于搜索的编辑器1008、搜索装置1009、元数据比较器1010、附加服务数据库1011、附加服务生成器1012、搜索结果生成器1013、信息存储装置1014、信息提供编辑器1015、信息提供元数据提取器1016、元数据DB 1017、信息提供者意图检测器1018、信息监视器1019、语法分析器1020、语法文法规则字典1021、语素处理器1022、语素字典1023、目录内容搜索器1024、信息DB 1025、搜索结果显示装置1026、搜索目录确定装置1027以及存储目录确定装置1028。
目录内容搜索器1024收集包含于分离自每一目录的内容中的文本。目录内容搜索器1024收集到的文本被传输至将在以下描述的语素处理器1022。
图10示出了工作信息21、大学入学考试信息13、不动产23、金融24、汽车25、电影及游戏26、购物27、交通信息28、旅游信息29、推荐30等作为在其中存储内容的目录,但还可采用其他目录。
语素字典1023可被实施为与图1所示的语素字典125相同的语素字典。语素处理器1022通过参考语素字典1023,针对每个词性将传输自目录内容搜索器1024的文本进行分离,并输出每个词性。
语法分析器1020基于语素处理器1022的语素处理结果,来对包含于内容内的文本执行语法分析。语法分析器1020在执行语法分析的同时,参考语法文法规则字典1021。
内容提供者意图检测器1018使用输出自语法分析器1020的语法分析结果来检测内容作者的意图。
信息监视器1019输出信息提供者意图检测器1018检测到的信息作者的意图,以使得用户可见。为此目的,信息监视器1019可使用图形化工具。
信息提供元数据提取器1016从元数据DB 1017中提取符合信息提供者意图检测器1018检测到的信息提供者意图的内容的元数据。
信息提供编辑器1015生成编辑器(其中,信息提供元数据提取器1016提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。
存储目录确定装置1028确定信息DB 1025上适于存储所述内容的目录。在此情况下,存储目录确定装置1028可通过参考信息提供者意图检测器1020检测到的内容提供者的意图来确定所述目录。
信息存储装置1014将整合了信息提供编辑器1015所生成的元数据的内容存储于信息DB 1025内。在此情况下,所述内容存储于存储目录确定装置1028所确定的目录内。
到目前为止所描述的组件用于收集内容,并基于作者的意图来对收集到的内容进行划分及存储。下文中,将对当信息搜索者通过输入关键字来请求进行搜索时可通过推导通过搜索意图检测而输入的详细关键字来更为精确地执行搜索的组件进行详细描述。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。
信息搜索窗口1001提供输入窗口,用于可通过该输入窗口输入关键字,诸如单词、短语或句子。进一步地,关键字输入装置1002将用户通过信息搜索窗口1001输入的关键字传输至关键字语素处理器1003。
语素处理器1003通过参考语素字典1023,针对每个词性将传输自关键字输入装置1002的关键字进行分离,并输出每个词性。
关键字语法分析器1004基于关键字语素处理器1003的语素处理结果,对搜索者输入的关键字执行语法分析。该关键字语法分析器1004在执行语法分析的同时,参考语法文法规则字典1021。
搜索者意图检测器1005使用输出自关键字语法分析器1004的语法分析结果来检测搜索者的意图。
信息监视器1006对搜索者意图检测器1005检测到的搜索者意图进行输出,以使得用户可见。为此目的,该信息监视器1006可使用图形化工具。
用于搜索的元数据提取器1007从元数据DB 1017中提取符合搜索者意图检测器1005检测到的搜索者意图的内容的元数据。
用于搜索的编辑器1008生成编辑器(其中,用于搜索的元数据提取器1007提取的元数据被形成为输入项),并将该编辑器提供给搜索者。
搜索目录确定装置1027确定信息DB 1025上适于搜索所述内容的目录。在此情况下,搜索目录确定装置1027可通过参考搜索者意图检测器1005检测到的搜素者的意图来确定所述目录。进一步地,搜索目录确定装置1027可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
搜索者1009对信息DB 1025中的具有与用于搜索的编辑器1008输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置1027中所确定的目录内执行所述搜索。
搜素装置1009可执行扩展搜索,该扩展搜索通过将用于搜索的编辑器1008输入的元数据替换为同义元数据来执行所述搜索。
进一步地,搜索装置1009可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之,搜索装置1009还可执行相同搜索、部分搜索或相关搜索。
元数据比较器1010将通过由用于搜索的编辑器1008输入的元数据与构成搜索装置1010所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较的方法来执行所述比较(确定所述一致性)。
附加服务数据库1011可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的担忧。
附加服务生成器1012生成与搜索键相关的附加服务。为此目的,附加服务生成器1012使用存储于附加服务数据库1011内的附加服务中的、适合于搜索者的搜索意图的附加服务。
附加服务数据库1011及附加服务生成器1012所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务等。
搜索结果生成器1013根据与输出自元数据比较器1010的搜索结果(内容)的一致性,来添加附加服务生成器1012所生成的附加服务。
搜索结果显示装置1026通过屏幕输出从搜索结果生成器1013生成的添加有附加服务的搜索结果,以将该结果提供给用户。
同时,可仅将搜索结果及一致性提供给用户,而不提供任何附加服务。这可以通过下面的方式来实现:附加服务生成器1012不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器1013亦不添加所生成的附加服务。
下文中,将参考图11,对考虑了以下情形的过程进行详细描述,该情形为推荐目录30上列有推荐中国餐馆及第一次生日聚会的体验经历的记录,且该记录作为信息被存储。图11为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。
首先,如图11A所示,目录内容搜索器1024收集列于推荐目录30上的推荐记录,并将该推荐记录传输至语素处理器1022。
之后,语素处理器1022通过参考语素字典1023来执行语素处理。图11B示出了语素处理器1022的语素处理结果。
之后,语法分析器1020对图11B执行语法分析。图11C示出了该语法分析器1020的语素分析结果。
进一步地,内容提供者意图检测器1018基于图11C来检测提供者的意图。图11D示出了内容提供者意图检测器1018检测到的提供者的意图。
之后,信息提供元数据提取器1016从元数据DB 1017中提取符合提供者意图的内容的元数据。
信息提供编辑器1015生成编辑器(其中,提取的元数据成为输入项),并将该编辑器提供给信息提供者。
在图11D中,符合“第一次生日聚会→地点→推荐”的内容是内容“第一次生日聚会地点提供”。如图11E所示,信息提供编辑器1015对内容提供者意图检测器1018检测到的内容提供者的意图进行排列。进一步地,信息提供编辑器1015自动将对应的元数据输入至图12A所示的编辑器的每一项中,其中图12B示出了输入结果。
存储目录确定装置1028确定信息DB 1025上适于存储所述内容的目录。在此情况下,该存储目录确定装置1028可通过参考内容提供者意图检测器1018检测到的内容提供者的意图来确定所述目录。
信息存储装置1014将整合了信息提供编辑器1015所生成的元数据的内容存储于信息DB 1025内。在此情况下,所述内容被存储于存储目录确定装置1028所确定的目录内。
根据本发明的示例性实施方式可以基于内容提供者的意图来对针对每一目录的相应信息进行划分,且可以对相应的元数据进行匹配和存储。
下文中,将参考图13对通过使用上述过程所存储的元数据来基于信息搜索者输入的关键字执行搜索的过程进行描述。
图13为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在该示例性实施方式中,当信息搜索者输入关键字时,可检测搜索者的搜索意图,并可以基于该搜索者的意图来进行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。
如图13所示,当用户输入通过信息搜索窗口1001输入关键字“ (请推荐这周六值得欣赏的音乐剧)”(1301)时,关键字语素处理器1003针对每个词性将输入的关键字进行分离,并在输出(这次/星期六/观看/音乐剧/推荐/期望)(1302)的同时,添加并输出词性信息及语义信息(名词/现在,名词/日期,形容词/好的感觉,名词/音乐剧,名词/推荐,动词/请求)(1303)。
之后,关键字语法分析器1004基于语素处理结果来执行语法分析,并之后输出(这次→星期六,值得→音乐剧,→推荐,→期望)作为结果(1304)。
可以理解的是,通过语法分析,示例句子中可存在两个上下文认知信息。一个是作为实际物理数据“所有的星期六”的日期,另一个是作为“意图”的“推荐,请求”。
因此,关键字语法分析器1004针对前者执行上下文认知处理,这将在以下进行描述。
首先,将对生成“本周六”的上下文认知实际数据的过程进行详细描述。图14示出了指示时间的上下文认知单词,其可列于语素字典1023内。如图14所示,将每个单词的语义信息定义为“过去”、“现在”或“将来”等。
图15通过指定“现在时间”的单位为“年”、“月”、“日”、“星期”、“时”、“分”、“秒”,示出了***所管理的情况。
图16示出了在当天对“本周六”的语言表示进行数量上的计算的方式。换言之,由于将获得的时间为指示将获得的时间的语言表示中的实际量化时间,当对“本周六”执行语素处理时,根据语义信息“本/当前,周六/星期六”而在***日历中获得的当前日期为星期三,并且由于当前***“星期六”为三天之后即“星期三→星期四→星期五→星期六”,故当将三天加到当前日期2008年11月6日之后,可生成实际数据2008年11月9日。
通过上述过程,还可将指示不同于当前时间的时间的语言表示变形为实际数据。参考图14-16描述的“本周六”的上下文认知实际数据的生成对应于图13中的1306、1307以及1308。
同时,搜索者意图检测器1005使用语法分析结果来将搜素者的意图检测为“音乐剧→推荐→请求”(1308)。
之后,用于搜索的元数据提取器1007从元数据DB 1017中提取适于搜索者意图即“音乐剧推荐请求”的内容的元数据,且用于搜索的编辑器1008生成编辑器(其中,用于搜索的元数据提取器1007提取的元数据为输入项),并将该编辑器提供给搜索者(1311)。在此情况下,履行日期“2008年11月9日”(即所生成的实际日期)被自动输入至编辑器。
结果,搜索者通过提供的编辑器来输入元数据(1312)。
搜索目录确定装置1027确定信息DB 1025上适于搜索所述内容的目录,且搜索装置1009对信息DB 1025中的具有与用于搜索的编辑器1008所输入的元数据相同的元数据的内容进行搜索(1313)。该搜索在搜索目录确定装置1027中确定的目录内执行。
在此情况下,搜索目录确定装置1027可通过参考搜索者意图检测器1005检测到的搜索者的意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
进一步地,搜索装置1009还可执行相同搜索、部分搜索或相关搜索。
之后,元数据比较器1010将通过用于搜索的编辑器1008输入的元数据与构成搜索装置1009所搜索的内容的元数据进行比较(1314)。进一步地,元数据比较器1010基于比较结果来仅选择并输出具有高度一致性的内容(1315)。
到目前,详细描述了根据搜索者输入的信息来检测搜索者的意图、基于检测到的意图来推导详细的元数据输入、自动输入用于生成实际数据的元数据以及通过使用该元数据来在符合搜索者意图的目录中执行搜索的过程。
在到目前为止所描述的示例性实施方式中,通过对输入语言表示进行分析来自动检测信息提供者或信息搜索者的意图。
例如,包含诸如“获取、买、购买、给予、请求、询问、寻找”等语言表示的表示被检测为被称为“信息搜索”的意图,因为信息“搜索”的语意在语意中被称为“寻找信息”;而所有包含诸如“卖、销售、提供、给予、呈现”等语言表示的表示均被检测为“信息提供”的意图,因为信息“提供”的语意在语意中被称为“信息提供”。之后,处理该意图。
将在以下进行描述的示例性实施方式采用由信息提供者或信息搜索者直接输入的方法,而非自动检测信息提供者及信息搜索者的意图。这是为了更为精确地检测信息提供者及信息搜索者的意图。
图17示出了根据本发明示例性实施方式的搜索***。构成根据本发明示例性实施方式的搜索***的块可通过S/W及H/W来实现。此外,构成所述搜索***的一些块可通过S/W来实现,而其余的块则可通过H/W来实现。
如图17所示,根据本发明示例性实施方式的搜索***包括:信息提供/搜索窗口1701、语素处理器1702、语素字典1703、语法分析器1704、语法文法规则字典1705、意图指定器1706、信息监视器1707、信息提供元数据提取器1708、信息提供编辑器1709、存储目录确定装置1710、信息存储单元1711、信息DB 1712、元数据DB 1713、用于搜索的元数据提取器1714、用于搜索的编辑器1715、搜索目录确定装置1716、搜索装置1717、元数据比较器1718、搜索结果生成器1719、搜索结果显示单元1720、附加服务数据库1721以及附加服务生成器1722。
信息提供/搜索窗口1701为用于输入将由信息提供者登记的信息或输入由信息搜索者提供的关键字的用户界面。
信息提供/搜索窗口1701提供有输入窗口1701-1、信息提供按钮1701-2以及信息搜索按钮1701-3。输入窗口1701-1为用于输入将被提供的信息或关键字的窗口,并且输入窗口1701-1可输入作为单词、短语或句子的信息及关键字。信息提供按钮1701-2是在提供并登记输入至输入窗口1701-1的信息时使用的按钮,而信息搜索按钮1701-3是用于命令对输入至输入窗口1701-1的关键字进行信息搜索的按钮。
通过信息提供/搜索窗口1701输入的信息或关键字被传输至语素处理器1702。
语素字典1703可被实施为与图1所示的语素字典125相同的语素字典。语素处理器1702通过参考语素字典1023来针对每个词性将通过信息提供/搜索窗口1701输入的信息或关键字进行分离,并输出每个词性。
语法分析器1704基于语素处理器1702的语素处理结果来对用户的输入信息或关键字执行语法分析。语法分析器1704在执行语法分析的同时,参考登记于语法文法规则字典1705内的文法规则。
意图指定器1706提供用于对信息提供者的意图或信息搜索者的意图进行直接指定的用户界面单元,并对语法分析结果所指定的意图进行整合以输出最终意图。
信息监视器1707对输出自意图指定器1706的最终意图进行输出,以使得用户可见。为此目的,该信息监视器1707可使用图形化工具。
信息提供元数据提取器1708从元数据DB 1713中提取符合输出自意图指定器1706的信息提供者的最终意图的内容的元数据。
信息提供编辑器1709生成编辑器(其中,信息提供元数据提取器1708提取的元数据被形成为输入项),并将该编辑器提供给信息提供者。
存储目录确定装置1710确定信息DB 1712上适于存储所述内容的目录。在此情况下,存储目录确定装置1710可通过参考意图指定器1706检测到的信息提供者的最终意图来确定所述目录。
信息存储单元1711将整合了信息提供编辑器1709所生成的元数据的内容存储于信息DB 1709内。在此情况下,所述内容存储于存储目录确定装置1710所确定的目录内。
用于搜索的元数据编辑器1714从元数据DB 1713中提取符合输出自意图指定器1706的信息提供者的最终意图的内容的元数据。
搜索编辑器1715生成编辑器(其中,用于搜索的元数据提取器1714提取的元数据被形成为输入项),并将该编辑器提供给搜索者。
搜索目录确定装置1716确定信息DB 1712上适于搜索所述内容的目录。在此情况下,搜索目录确定装置1716可通过参考输出自意图指定器1706的搜索者的最终意图来确定所述目录。
进一步地,搜索目录确定装置1716可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
搜索装置1717对信息DB 1712中的具有与由用于搜索的编辑器1715输入的元数据相同的元数据的内容进行搜索。在此情况下,在搜索目录确定装置1716所确定的目录中执行所述搜索。
搜索装置1717可执行扩展搜索,该扩展搜索通过将搜索编辑器1715输入的元数据替换为同义元数据来执行所述搜索。
进一步地,搜索装置1717可搜索在结构及单词方面具有与元数据完全相同的元数据的内容以及仅在结构及单词中的词性方面具有与元数据相同的元数据的内容。换言之,搜索装置1717还可执行相同搜索、部分搜索或相关搜索。
元数据比较器1718将通过由用于搜索的编辑器1715输入的元数据与构成搜索装置1717所搜索的内容的元数据进行比较,并基于比较结果来仅选择和输出具有高度一致性的内容。如上所述,可通过将以表格格式形成的元数据分别进行比较的方法来执行所述比较(确定所述一致性)。
附加服务数据库1721可存储用于提供适合于搜索者的搜索意图的站点信息或相关广告服务等的单元。
附加服务生成器1722生成与搜索键相关的附加服务。为此目的,附加服务生成器1722使用存储于附加服务数据库1721内的附加服务中的、适合于搜索者的搜索意图的附加服务。
附加服务数据库1721及附加服务生成器1722所提供的附加服务可被实施为内容上下文认知服务。在此情况下,该内容上下文认知服务的示例可包括导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务、行政服务等。
搜索结果生成器1719根据与输出自元数据比较器1718的搜索结果(内容)的一致性,来添加附加服务生成器1722所生成的附加服务。
搜索结果显示单元1720通过屏幕输出从搜索结果生成器1719生成的添加有附加服务的搜索结果,以将该结果提供给用户。
同时,可仅将搜索结果及一致性提供给用户,而不提供附加服务。这可以通过以下的方式来实现:附加服务生成器1722不生成附加服务,或即使附加服务生成器113生成了附加服务,搜索结果生成器1719亦不添加所生成的附加服务。
图18为用于对根据本发明另一示例性实施方式的搜索方法进行解释的流程图。
如图18所示,当用户输入“对课程进行计划”至信息提供/搜索窗口1701的输入窗口1701-1中并按下信息提供按钮1701-2(1801)时,语素处理器1702通过参考语素字典1703来针对每个词性将“对课程进行计划”进行分离,以将其输出为“对课程进行计划”(1802)。
之后,语法分析器1704对语素处理结果执行语法分析,并输出结果(课程→计划)(1803)。
之后,当意图指定器1706将信息提供者的意图指定为“提供”(1804和1805)时,意图指定器1706基于语法分析来输出整合了所指定意图的最终意图“课程→计划→提供”(1806)。
之后,信息提供元数据提取器1708从元数据DB 1713中提取适于信息提供者的最终意图“课程→计划→提供”的内容的元数据(1807)。
信息提供编辑器1709生成编辑器(其中,提取的元数据成为输入项),并将该编辑器提供给信息提供者(1808)。结果,信息提供者通过所提供的编辑器来输入元数据(1809)。
之后,存储目录确定装置1710确定信息DB 1712上适于存储所述内容的目录(1810)。
进一步地,信息存储装置1711将整合了由信息提供编辑器1709输入的元数据的内容存储于信息DB 1712内。在此情况下,所述内容被存储于由存储目录确定装置1710所确定的目录内。
到目前为止,详细描述了根据信息提供者输入的信息及意图来检测信息提供者的最终意图、并基于检测到的意图来推导将被存储为单个内容的详细元数据输入的过程。
下文中,将参考图19来对通过使用上述过程所存储的元数据来基于信息搜索者提供的关键字及意图来执行搜索的过程进行描述。
图19为用于对根据本发明另一示例性实施方式的搜索方法进行解释的图示。在本发明的该示例性实施方式中,信息搜索者可基于关键字及意图来执行详细且精确的搜索。在此情况下,用户输入的关键字的示例可包括单词、短语以及句子。
如图19所示,当用户输入“计划列表”至信息提供/搜索窗口1701的输入窗口1701-1并按下搜索按钮1701-3(1901)时,语素处理器1702通过参考语素字典1703来针对每个词性将“计划列表”进行分离,以将其输出为“计划/列表”(1902)。
之后,语法分析器1704对语素处理结果执行语法分析,并输出结果(计划→列表)(1903)。
之后,当意图指定器1706将信息提供者的意图指定为“搜索”(1904和1905)时,意图指定器1706基于语法分析来输出整合了所指定意图的最终意图“计划→列表→搜索”(1906)。
之后,用于搜索的元数据提取器1714从元数据DB 1713中提取适于搜索者的最终意图“计划→列表→搜索”的内容的元数据,且用于搜索的编辑器1715生成编辑器(其中,用于搜索的元数据提取器1714提取的元数据是输入项),并将该编辑器提供给搜索者(1908)。
结果,搜索者通过所提供的编辑器输入元数据(1909)。
搜索目录确定装置1716确定信息DB 1712上适于搜索所述内容的目录(1910),且搜索装置1717对信息DB 1712的具有与由用于搜索的编辑器1715输入的元数据相同的元数据的内容进行搜索(1911)。在搜索目录确定装置1716中所确定的目录内执行所述搜索。
在此情况下,搜索目录确定装置1716可通过参考意图指定器1706检测到的搜索者意图来确定所述目录。可另外确定与所确定的目录相类似的目录。这可执行更宽范围的搜索。
进一步地,搜索装置1717还可执行相同搜索、部分搜索或相关搜索。
之后,元数据比较器1718将通过用于搜索的编辑器1715输入的元数据与构成搜索装置1717所搜索的内容的元数据进行比较(1912)。进一步地,元数据比较器1718基于比较结果来仅选择并输出具有高度一致性的内容(1913)。
到目前为止,详细描述了基于搜索者输入的信息及意图来推导详细元数据输入并通过使用输入的元数据来在符合搜索者的意图的目录内执行所述搜索的过程。
上述示例性实施方式可用于宣传候选人以进行电子投票。
图20示出了输入元数据至编辑器的结果,该结果通过输入“提供候选人的宣传信息”至信息提供/搜索窗1701并对其执行语素处理、语法分析、意图指定以及元数据提取而生成,且所述编辑器被提供给信息提供者。
之后,当通过存储目录确定来将所述信息存储于信息DB 1712内时,可将候选人的宣传资料通过PC或移动电话等分发给投票者。因此,可通过使用目前使用成本很低的宣传纸来迅速地提供候选人的宣传资料。
上述的示例性实施方式可实施于移动信息装置(诸如移动电话)中以及其他信息装置内。此外,信息提供按钮及信息搜索按钮可对应于/分派至移动信息装置(诸如移动电话)以及其他信息装置的特定按钮(按键)。
虽然已结合目前被视为实际示例性实施方式的实施方式对本发明进行了描述,但可以理解的是,本发明并不局限于所公开的实施方式,相反地,本发明意欲覆盖包含于所附权利要求书的精神及范围内的各种变化及等价布置。
Claims (28)
1.一种用于搜索信息的方法,该方法包括:
通过使用针对关键字的分析结果来检测搜索者的意图;
向所述搜索者提供符合所述搜索者的意图的编辑器;以及
搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容;
该方法进一步包括提取符合所述搜索者的意图的内容的元数据,
其中编辑器的提供提供作为符合所述搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
2.根据权利要求1所述的方法,该方法进一步包括:
将输入的关键字分离为语意单词;以及
对分离后的语意单词执行语法分析,
其中,对搜索者的意图的检测通过使用执行所述语法分析时的语法分析结果来检测所述搜索者的意图。
3.根据权利要求2所述的方法,其中所述语法分析的执行将语法表达式输出作为所述语法分析结果,其中通过分析句子内分离后的语意单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
4.根据权利要求3所述的方法,其中所述语法表达式为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
5.根据权利要求3所述的方法,其中语法分析的执行参考语法文法规则字典,以分析句子内分离后的语意单词是否具有任何文法关系以及语义关联,以及
所述语法文法规则字典列有短语结构文法、格文法、敏感文法以及词汇文法中的至少一者。
6.根据权利要求2所述的方法,其中所述分离针对每个词性来对所述关键字进行分离。
7.根据权利要求6所述的方法,其中所述分离通过参考与每个单词的词性相关的信息来针对每个词性将所述关键字进行分离,所述与每个单词的词性相关的信息以数据库方式存储于语素字典内。
8.根据权利要求1所述的方法,该方法进一步包括通过参考信息提供者的意图来确定用于执行搜索的目录,
其中所述搜索对与所确定的目录相同或相似的目录中的内容进行搜索。
9.根据权利要求1所述的方法,其中所述关键字为单词单元、短语单元以及句子单元中的任一者。
10.根据权利要求1所述的方法,其中所述搜索对具有与通过所述编辑器的输入项输入的元数据中的至少一者相同的元数据、或具有与通过所述编辑器的输入项输入的元数据中的至少一者同义的元数据的内容进行搜索。
11.根据权利要求1所述的方法,该方法进一步包括在搜索时将附加服务添加至搜索结果中。
12.根据权利要求11所述的方法,其中所述附加服务为内容上下文认知服务,并且
该内容上下文认知服务包括以下各项中的至少一者:导航服务、销售服务、广告服务、教育服务、咨询服务、推荐服务以及行政服务。
13.根据权利要求1所述的方法,其中所述编辑器的输入项中的至少一者被自动输入作为通过使用所述关键字生成的实际数据。
14.根据权利要求1所述的方法,该方法进一步包括通过将输入的元数据与构成所搜索的内容的元数据进行比较,来分别选择并输出具有高度一致性的内容。
15.一种提供用于搜索的信息的方法,该方法包括:
通过使用针对包含于信息内的文本的分析结果,来检测提供所述信息的信息提供者的意图;
将符合所述信息提供者的意图的编辑器提供给用户;以及
对整合了通过所述编辑器的输入项输入的元数据的内容进行存储,
该方法进一步包括提取符合所述信息提供者的意图的内容的元数据,
其中编辑器的提供提供作为符合所述信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
16.根据权利要求15所述的方法,该方法进一步包括:
将包含于输入信息内的文本分离成语意单词;以及
对分离后的语意单词执行语法分析,
其中对信息提供者的意图的检测通过使用执行所述语法分析时的语法分析结果来检测提供所述信息的所述信息提供者的意图。
17.根据权利要求16所述的方法,其中语法分析的执行将语法表达式输出作为所述语法分析结果,其中通过分析句子内分离后的语意单词是否具有任何文法关系以及语义关联来获取所述语法表达式。
18.根据权利要求17所述的方法,其中所述语法表达式为逻辑表达式、修饰-被修饰以及语法列表表达式中的至少一者。
19.根据权利要求17所述的方法,其中语法分析的执行参考语法文法规则字典,以分析句子内分离后的语意单词是否具有任何文法关系以及语义关联,以及
所述语法文法规则字典列有短语结构文法、格文法、敏感文法以及词汇文法中的至少一者。
20.根据权利要求16所述的方法,其中所述分离针对每个词性来对所述文本进行分离。
21.根据权利要求20所述的方法,其中所述分离通过参考与每个单词的词性相关的信息来针对每个词性将所述文本进行分离,所述与每个单词的词性相关的信息以数据库方式存储于语素字典内。
22.根据权利要求15所述的方法,该方法进一步包括通过参考所述信息提供者的意图来确定存储所述信息的目录,
其中所述内容的存储将所述内容存储于所确定的目录内。
23.根据权利要求22所述的方法,该方法进一步包括对包含于针对每一目录划分的内容内的文本进行收集,
其中所述检测使用针对收集到的文本的分析结果。
24.一种提供用于搜索的信息的方法,该方法包括:
对包含于针对每一目录划分的内容内的文本进行收集;
通过使用针对收集到的文本的分析结果,来检测提供信息的信息提供者的意图;
将符合所述信息提供者的意图的编辑器提供给用户;以及
对整合了通过所述编辑器的输入项输入的元数据的内容进行存储,
该方法进一步包括提取符合所述信息提供者的意图的内容的元数据,
其中编辑器的提供提供作为符合所述信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
25.一种搜索信息的方法,该方法包括:
接收关键字;
接收输入所述关键字的搜索者的意图;
将符合最终意图的编辑器提供给所述搜索者,所述最终意图整合了对所述关键字的分析结果以及所述搜索者的意图;以及
搜索具有与通过所述编辑器的输入项输入的元数据相关联的元数据的内容,
该方法进一步包括提取符合所述搜索者的意图的内容的元数据,
其中编辑器的提供提供作为符合所述搜索者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
26.根据权利要求25所述的方法,该方法进一步包括:
将输入的关键字分离为语意单词;以及
对分离后的语意单词执行语法分析,
其中所述编辑器的提供使用执行所述语法分析时的语法分析结果。
27.一种提供用于搜索的信息的方法,该方法包括:
接收信息;
接收输入所述信息的信息提供者的意图;
将符合最终意图的编辑器提供给所述信息提供者,所述最终意图整合了对所述信息的分析结果以及所述信息提供者的意图;以及
对整合了通过所述编辑器的输入项输入的元数据的内容进行存储,
该方法进一步包括提取符合所述信息提供者的意图的内容的元数据,
其中编辑器的提供提供作为符合所述信息提供者的意图的编辑器的编辑器,在该编辑器中,被提取的元数据成为输入项。
28.根据权利要求27所述的方法,该方法进一步包括:
将输入的信息分离为语意单词;以及
对分离后的语意单词执行语法分析,
其中所述编辑器的提供使用执行所述语法分析时的语法分析结果。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080125767A KR101042515B1 (ko) | 2008-12-11 | 2008-12-11 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
KR10-2008-0125767 | 2008-12-11 | ||
PCT/KR2009/007443 WO2010068068A2 (ko) | 2008-12-11 | 2009-12-11 | 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102246164A CN102246164A (zh) | 2011-11-16 |
CN102246164B true CN102246164B (zh) | 2017-09-08 |
Family
ID=42243243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980150114.1A Active CN102246164B (zh) | 2008-12-11 | 2009-12-11 | 基于用户意图的信息搜索方法以及信息提供方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9256679B2 (zh) |
JP (1) | JP5481615B2 (zh) |
KR (1) | KR101042515B1 (zh) |
CN (1) | CN102246164B (zh) |
WO (1) | WO2010068068A2 (zh) |
Families Citing this family (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101106772B1 (ko) * | 2009-05-14 | 2012-01-18 | 주식회사 솔트룩스 | 사용자 선호 지식 베이스 기반의 컨텐츠 추천 방법 및 시스템 |
EP2508896B1 (en) * | 2009-12-03 | 2019-04-17 | Hitachi High-Technologies Corporation | Automatic analyzing device |
CN101883341A (zh) * | 2010-06-29 | 2010-11-10 | 中国人民大学 | 一种基于短信终端的信息查询***及查询方法 |
TWI480742B (zh) * | 2011-03-18 | 2015-04-11 | Ind Tech Res Inst | 基於動態語言模型之推薦方法與推薦系統 |
EP2702509A4 (en) * | 2011-04-28 | 2015-05-20 | Microsoft Technology Licensing Llc | SEARCH RESULTS FOR ALTERNATIVE MARKETS |
US9124590B2 (en) * | 2011-07-19 | 2015-09-01 | Sk Planet Co., Ltd. | Intelligent information providing system and method |
CN103164449B (zh) * | 2011-12-15 | 2016-04-13 | 腾讯科技(深圳)有限公司 | 一种搜索结果的展现方法与装置 |
KR101347123B1 (ko) * | 2012-04-17 | 2014-01-03 | 박석일 | 정보검색장치 및 정보검색방법, 컴퓨터 판독가능 기록매체 |
US9747373B2 (en) | 2012-05-11 | 2017-08-29 | Zte Corporation | Inquiry method and system, inquiry search server and inquiry terminal |
GB2503223A (en) | 2012-06-19 | 2013-12-25 | Ibm | Redrafting text strings using a vocabulary |
US8577671B1 (en) | 2012-07-20 | 2013-11-05 | Veveo, Inc. | Method of and system for using conversation state information in a conversational interaction system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
CN102866989B (zh) * | 2012-08-30 | 2016-09-07 | 北京航空航天大学 | 基于词语依存关系的观点抽取方法 |
WO2014039106A1 (en) * | 2012-09-10 | 2014-03-13 | Google Inc. | Answering questions using environmental context |
CN102880723B (zh) * | 2012-10-22 | 2015-08-05 | 深圳市宜搜科技发展有限公司 | 一种识别用户检索意图的搜索方法和*** |
US9383216B2 (en) | 2012-10-31 | 2016-07-05 | International Business Machines Corporation | Providing online mapping with user selected preferences |
KR20140119217A (ko) * | 2013-03-27 | 2014-10-10 | (주)네오넷코리아 | 키워드 검색을 통해 사진 검색이 가능한 사진 공유 시스템 및 사진 공유 방법 |
CN104077320B (zh) * | 2013-03-29 | 2019-12-17 | 北京百度网讯科技有限公司 | 一种用于生成待发布信息的方法和装置 |
DK2994908T3 (da) | 2013-05-07 | 2019-09-23 | Veveo Inc | Grænseflade til inkrementel taleinput med realtidsfeedback |
CN104142955A (zh) * | 2013-05-08 | 2014-11-12 | ***通信集团浙江有限公司 | 一种推荐学习课程的方法和终端 |
CN103400273A (zh) * | 2013-07-18 | 2013-11-20 | 苏州悦驾信息科技有限公司 | 本地化汽车o2o服务*** |
WO2015037814A1 (ko) * | 2013-09-16 | 2015-03-19 | 고려대학교 산학협력단 | 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법 |
KR20150062832A (ko) * | 2013-11-29 | 2015-06-08 | 현대엠엔소프트 주식회사 | 내비게이션의 검색 방법 및 그 장치 |
US10778618B2 (en) * | 2014-01-09 | 2020-09-15 | Oath Inc. | Method and system for classifying man vs. machine generated e-mail |
CN104462212B (zh) * | 2014-11-04 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 信息展示方法和装置 |
KR102094934B1 (ko) * | 2014-11-19 | 2020-03-31 | 한국전자통신연구원 | 자연어 질의 응답 시스템 및 방법 |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US20160224524A1 (en) * | 2015-02-03 | 2016-08-04 | Nuance Communications, Inc. | User generated short phrases for auto-filling, automatically collected during normal text use |
US20160283845A1 (en) * | 2015-03-25 | 2016-09-29 | Google Inc. | Inferred user intention notifications |
US10956957B2 (en) * | 2015-03-25 | 2021-03-23 | Facebook, Inc. | Techniques for automated messaging |
KR101656741B1 (ko) * | 2015-04-23 | 2016-09-12 | 고려대학교 산학협력단 | 프레임 기반 의견스팸 판단장치, 프레임 기반 의견스팸 판단방법, 프레임 기반으로 의견스팸을 판단하기 위한 컴퓨터 프로그램 및 컴퓨터 판독가능 기록매체 |
CN104899308A (zh) * | 2015-06-12 | 2015-09-09 | 北京奇虎科技有限公司 | 用于浏览器页面出错时的信息推荐方法及装置 |
WO2017017738A1 (ja) * | 2015-07-24 | 2017-02-02 | 富士通株式会社 | 符号化プログラム、符号化装置、及び符号化方法 |
CN105068661B (zh) * | 2015-09-07 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和*** |
CN105425978A (zh) * | 2015-10-26 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 输入数据的处理方法及装置 |
US10613825B2 (en) * | 2015-11-30 | 2020-04-07 | Logmein, Inc. | Providing electronic text recommendations to a user based on what is discussed during a meeting |
WO2017163346A1 (ja) * | 2016-03-23 | 2017-09-28 | 株式会社野村総合研究所 | 文章解析システム及びプログラム |
CN106407181B (zh) * | 2016-09-07 | 2019-05-14 | 武汉众犇慧通科技有限公司 | 旅游目的地中的数据语义关联分析方法及*** |
US10650621B1 (en) | 2016-09-13 | 2020-05-12 | Iocurrents, Inc. | Interfacing with a vehicular controller area network |
CN106599304B (zh) * | 2016-12-29 | 2020-03-24 | 中南大学 | 一种针对中小型网站的模块化用户检索意图建模方法 |
US10009462B1 (en) * | 2017-03-28 | 2018-06-26 | International Business Machines Corporation | Call filtering to a user equipment |
CN107027065B (zh) * | 2017-04-21 | 2020-03-13 | 海信集团有限公司 | 非标准频道名称的识别方法和装置 |
CN107832432A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 一种搜索结果排序方法、装置、服务器和存储介质 |
CN108228191B (zh) * | 2018-02-06 | 2022-01-25 | 威盛电子股份有限公司 | 语法编译***以及语法编译方法 |
TWI660341B (zh) * | 2018-04-02 | 2019-05-21 | 和碩聯合科技股份有限公司 | 一種搜尋方法以及一種應用該方法的電子裝置 |
KR102072723B1 (ko) * | 2018-05-25 | 2020-02-03 | 에스케이텔레콤 주식회사 | 콘텐츠 추천어 제공 방법 및 그 콘텐츠 제공 장치 |
US20210240930A1 (en) * | 2018-06-13 | 2021-08-05 | Sony Corporation | Information processing apparatus and method for processing information |
CN110347910A (zh) * | 2019-05-28 | 2019-10-18 | 成都美美臣科技有限公司 | 一个电子商务网站搜索结果过滤规则 |
CN110413882B (zh) * | 2019-07-15 | 2023-10-31 | 创新先进技术有限公司 | 信息推送方法、装置及设备 |
CN115668206A (zh) | 2020-03-10 | 2023-01-31 | 梅特凯股份有限公司 | 推动多语言、多轮次、多领域虚拟助理的并行假设推理 |
US11995561B2 (en) | 2020-03-17 | 2024-05-28 | MeetKai, Inc. | Universal client API for AI services |
WO2021188719A1 (en) | 2020-03-17 | 2021-09-23 | MeetKai, Inc. | An intelligent layer to power cross platform, edge-cloud hybrid artificail intelligence services |
CN111475722B (zh) * | 2020-03-31 | 2023-04-18 | 百度在线网络技术(北京)有限公司 | 用于发送信息的方法和装置 |
CN111625706B (zh) * | 2020-05-22 | 2023-05-30 | 北京百度网讯科技有限公司 | 信息检索方法、装置、设备及存储介质 |
WO2021262605A1 (en) * | 2020-06-24 | 2021-12-30 | MeetKai, Inc. | A system and method for handling out of scope or out of domain user inquiries |
US11921712B2 (en) | 2020-10-05 | 2024-03-05 | MeetKai, Inc. | System and method for automatically generating question and query pairs |
TWI804763B (zh) * | 2020-10-22 | 2023-06-11 | 楊蕙如 | 適合於通訊或社群平台的交易方法及系統 |
CN112883165B (zh) * | 2021-03-16 | 2022-12-02 | 山东亿云信息技术有限公司 | 一种基于语义理解的智能全文检索方法及*** |
KR102625347B1 (ko) | 2021-11-10 | 2024-01-15 | 동의대학교 산학협력단 | 동사와 형용사와 같은 품사를 이용한 음식 메뉴 명사 추출 방법과 이를 이용하여 음식 사전을 업데이트하는 방법 및 이를 위한 시스템 |
CN114169966B (zh) * | 2021-12-08 | 2022-08-05 | 海南港航控股有限公司 | 一种用张量提取货物订单元数据的方法及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030006201A (ko) * | 2001-07-12 | 2003-01-23 | 서정연 | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 |
KR20080052173A (ko) * | 2006-12-05 | 2008-06-11 | 한국전자통신연구원 | 자연어 분석을 통한 미디어 정보 검색 방법 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962739A (ja) * | 1995-08-22 | 1997-03-07 | Hitachi Ltd | 相談窓口割り当て方法および装置 |
KR100361166B1 (ko) | 1999-11-13 | 2002-11-18 | 김시환 | 정보 검색 시스템 및 그 방법 |
US6766320B1 (en) * | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning |
KR20020028593A (ko) | 2000-10-11 | 2002-04-17 | 김중문 | 유해 단어 차단 방법 |
KR100484944B1 (ko) | 2002-12-24 | 2005-04-25 | 한국전자통신연구원 | 국소 구문관계 및 의미 공기사전에 기반한 형태소 의미자동 태깅장치 |
JP2004234421A (ja) * | 2003-01-31 | 2004-08-19 | Hitachi Kokusai Electric Inc | 情報検索方法およびそれを用いた情報検索システム |
JP2004302660A (ja) * | 2003-03-28 | 2004-10-28 | Toshiba Corp | 質問応答システム、質問応答方法及びプログラム |
US7660400B2 (en) * | 2003-12-19 | 2010-02-09 | At&T Intellectual Property Ii, L.P. | Method and apparatus for automatically building conversational systems |
US7496500B2 (en) | 2004-03-01 | 2009-02-24 | Microsoft Corporation | Systems and methods that determine intent of data and respond to the data based on the intent |
JP2005258496A (ja) * | 2004-03-09 | 2005-09-22 | Hitachi Ltd | 検索意図を表す文字列を利用した情報検索システム |
KR20050092955A (ko) | 2004-03-17 | 2005-09-23 | (주)다음소프트 | 온라인 광고 시스템 및 광고 방법 |
US7747601B2 (en) * | 2006-08-14 | 2010-06-29 | Inquira, Inc. | Method and apparatus for identifying and classifying query intent |
KR100594500B1 (ko) | 2004-07-30 | 2006-06-30 | 에스케이 텔레콤주식회사 | 메시지 분석을 통한 지역정보 제공 시스템 및 그 방법 |
US7565627B2 (en) * | 2004-09-30 | 2009-07-21 | Microsoft Corporation | Query graphs indicating related queries |
KR100670789B1 (ko) | 2004-12-03 | 2007-01-17 | 한국전자통신연구원 | 유해 사이트 차단을 위한 다단계 텍스트 필터링 방법 |
KR100597435B1 (ko) | 2004-12-07 | 2006-07-10 | 한국전자통신연구원 | 정보검색 및 질문응답시스템에서의 하이브리드 기반 질문분류 시스템 및 방법 |
KR100669534B1 (ko) | 2004-12-09 | 2007-01-16 | 학교법인 울산공업학원 | 문장추상화와 개연규칙을 활용하는 문서요약 방법과 시스템, 그리고 문장 의미 분석 및 표현방법 |
JP3999812B2 (ja) * | 2005-01-25 | 2007-10-31 | 松下電器産業株式会社 | 音復元装置および音復元方法 |
KR20060087735A (ko) | 2005-01-31 | 2006-08-03 | 삼성전자주식회사 | 개선된 스팸성 메시지 필터링을 제공하는 시스템 및 방법 |
US20060212142A1 (en) * | 2005-03-16 | 2006-09-21 | Omid Madani | System and method for providing interactive feature selection for training a document classification system |
JP2006285847A (ja) * | 2005-04-04 | 2006-10-19 | Konica Minolta Holdings Inc | 画像検索システム、およびプログラム |
KR100726603B1 (ko) | 2005-08-01 | 2007-06-11 | 에스케이 텔레콤주식회사 | 광고 유발 메시징 서비스 시스템 및 그 방법 |
KR20070029389A (ko) | 2005-09-09 | 2007-03-14 | 주식회사 엠퓨처 | 핵심 키워드를 이용한 광고 서비스 제공 방법, 시스템 및이를 구현하기 위한 프로그램이 기록된 기록매체 |
KR100775680B1 (ko) | 2005-10-25 | 2007-11-09 | 에스케이 텔레콤주식회사 | 이동통신 단말기의 채팅을 이용한 광고 컨텐츠 제공 방법및 그 시스템 |
JP4468294B2 (ja) * | 2005-12-08 | 2010-05-26 | 日本電信電話株式会社 | 体験情報評価装置及びプログラム及びコンピュータ読み取り可能な記録媒体 |
KR100691400B1 (ko) | 2006-03-31 | 2007-03-12 | 엔에이치엔(주) | 부가 정보를 이용하여 형태소를 분석하는 방법 및 상기방법을 수행하는 형태소 분석기 |
KR100857124B1 (ko) | 2006-06-27 | 2008-09-05 | 성균관대학교산학협력단 | 유해 메시지 여과 시스템과 그 여과 방법 및 이를 기록한기록매체 |
US8255383B2 (en) * | 2006-07-14 | 2012-08-28 | Chacha Search, Inc | Method and system for qualifying keywords in query strings |
JP4722819B2 (ja) * | 2006-11-29 | 2011-07-13 | 日本電信電話株式会社 | 情報公開システムおよび情報公開方法 |
KR100836878B1 (ko) | 2006-11-29 | 2008-06-11 | 한국과학기술정보연구원 | 정보 검색 시스템에서의 주제 또는 분야 할당 장치 및 그방법 |
KR100757951B1 (ko) | 2007-01-02 | 2007-09-11 | 김수현 | 웹페이지의 형태소 분석을 통한 검색 방법 |
US20080172380A1 (en) * | 2007-01-17 | 2008-07-17 | Wojciech Czyz | Information retrieval based on information location in the information space. |
KR100786342B1 (ko) * | 2007-01-30 | 2007-12-17 | (주) 프람트 | 사용자 동적 정보를 이용한 콘텐츠의 검색 방법 |
US7805450B2 (en) * | 2007-03-28 | 2010-09-28 | Yahoo, Inc. | System for determining the geographic range of local intent in a search query |
KR100892842B1 (ko) * | 2007-08-08 | 2009-04-10 | 엔에이치엔(주) | 사용자 중심 정보탐색 방법 및 시스템 |
US8301651B2 (en) * | 2007-11-21 | 2012-10-30 | Chacha Search, Inc. | Method and system for improving utilization of human searchers |
US20090313117A1 (en) * | 2008-06-16 | 2009-12-17 | Yahoo! Inc. | Targeted advertising |
-
2008
- 2008-12-11 KR KR1020080125767A patent/KR101042515B1/ko active IP Right Grant
-
2009
- 2009-12-11 US US13/139,118 patent/US9256679B2/en active Active
- 2009-12-11 CN CN200980150114.1A patent/CN102246164B/zh active Active
- 2009-12-11 JP JP2011540611A patent/JP5481615B2/ja active Active
- 2009-12-11 WO PCT/KR2009/007443 patent/WO2010068068A2/ko active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030006201A (ko) * | 2001-07-12 | 2003-01-23 | 서정연 | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 |
KR20080052173A (ko) * | 2006-12-05 | 2008-06-11 | 한국전자통신연구원 | 자연어 분석을 통한 미디어 정보 검색 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20100067285A (ko) | 2010-06-21 |
US20110246496A1 (en) | 2011-10-06 |
CN102246164A (zh) | 2011-11-16 |
JP2012511769A (ja) | 2012-05-24 |
WO2010068068A3 (ko) | 2010-09-16 |
KR101042515B1 (ko) | 2011-06-17 |
US9256679B2 (en) | 2016-02-09 |
WO2010068068A2 (ko) | 2010-06-17 |
JP5481615B2 (ja) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102246164B (zh) | 基于用户意图的信息搜索方法以及信息提供方法 | |
Welbers et al. | Text analysis in R | |
CN105824959B (zh) | 舆情监控方法及*** | |
US9501467B2 (en) | Systems, methods, software and interfaces for entity extraction and resolution and tagging | |
US8977953B1 (en) | Customizing information by combining pair of annotations from at least two different documents | |
US7689557B2 (en) | System and method of textual information analytics | |
US8812505B2 (en) | Method for recommending best information in real time by appropriately obtaining gist of web page and user's preference | |
US8135669B2 (en) | Information access with usage-driven metadata feedback | |
US20090138466A1 (en) | System and Method for Search | |
US20170308523A1 (en) | A method and system for sentiment classification and emotion classification | |
Chen et al. | Automatically extracting tourism-related opinion from Chinese social media | |
CN103853824A (zh) | 一种基于深度语义挖掘的内文广告发布方法与*** | |
KR20190076381A (ko) | 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템 | |
CN106575292A (zh) | 用于跨应用填写表单的命名实体的概念识别和捕获 | |
KR101007284B1 (ko) | 인터넷을 이용한 의견 검색 시스템 및 그 방법 | |
Wegrzyn-Wolska et al. | Tweets mining for French presidential election | |
CN108470289A (zh) | 基于电商购物平台的虚拟物品发放方法及设备 | |
Walha et al. | A Lexicon approach to multidimensional analysis of tweets opinion | |
Pak | Automatic, adaptive, and applicative sentiment analysis | |
Wang et al. | CA-CD: context-aware clickbait detection using new Chinese clickbait dataset with transfer learning method | |
Trevisan et al. | Talking about mobile communication systems: verbal comments in the web as a source for acceptance research in large-scale technologies | |
KR101026986B1 (ko) | 언어 표현 해석에 기반한 정보 검색방법 및 정보 제공방법 | |
García-Pablos et al. | OpeNER: open tools to perform natural language processing on accommodation reviews | |
Deshpande et al. | BI and sentiment analysis | |
Mei‐fang et al. | Product online review analysis using fuzzy ontology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |