CN112236768A - 搜索文本生成***和搜索文本生成方法 - Google Patents
搜索文本生成***和搜索文本生成方法 Download PDFInfo
- Publication number
- CN112236768A CN112236768A CN201980037385.XA CN201980037385A CN112236768A CN 112236768 A CN112236768 A CN 112236768A CN 201980037385 A CN201980037385 A CN 201980037385A CN 112236768 A CN112236768 A CN 112236768A
- Authority
- CN
- China
- Prior art keywords
- text
- search
- word
- search text
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000004458 analytical method Methods 0.000 claims description 60
- 230000008569 process Effects 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 24
- 230000002093 peripheral effect Effects 0.000 description 19
- 230000000877 morphologic effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 10
- 239000003814 drug Substances 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- WBMKMLWMIQUJDP-STHHAXOLSA-N (4R,4aS,7aR,12bS)-4a,9-dihydroxy-3-prop-2-ynyl-2,4,5,6,7a,13-hexahydro-1H-4,12-methanobenzofuro[3,2-e]isoquinolin-7-one hydrochloride Chemical compound Cl.Oc1ccc2C[C@H]3N(CC#C)CC[C@@]45[C@@H](Oc1c24)C(=O)CC[C@@]35O WBMKMLWMIQUJDP-STHHAXOLSA-N 0.000 description 3
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明的目的在于提供一种能够基于用户输入的自然文本自动地生成合适的搜索文本的搜索文本生成***。搜索文本生成服务器(300)对接收到的输入文本进行分析,判定与运算符相对应的词和与该词相邻的目标词,并且,基于如此判定的词,自动地生成与输入文本相对应的搜索文本。
Description
技术领域
本发明涉及一种基于由用户输入的自然文本来生成搜索文本的搜索文本生成***。
背景技术
近年来,在互联网上公开了许多信息,互联网用户可以在搜索引擎中输入关键词,从互联网上的庞大的WEB页面中指定期望的WEB页面,浏览所需的信息。
此外,商用数据库等的用户可以创建包括关键词、逻辑运算符,括号等的搜索式,并从商用数据库中取得目标信息。
然而,在想要通过搜索取得期望的信息的情况下,如上述的关键词的输入,或包括关键词、逻辑运算符、括号等的搜索式的创建很麻烦,此外,如果不是习惯了检索式的创建的人,则很难获得符合搜索意图的搜索结果。
因此,例如,提出了一种基于用户输入的自然文本来自动创建搜索式的信息搜索装置(参照专利文献1)。
该信息搜索装置基于用户输入的以自然文本的搜索提问来创建搜索式。更具体地,参照存储有搜索提问中包括的用语的同义词、关联词、层次关系的搜索用语词典来创建使用运算符等的搜索式,并使用所创建的搜索式对搜索目标的数据库进行搜索。此外,构成为,在获得搜索结果之后,向用户进行回答件数是否合适的询问,并根据该询问的回答结果,使用上述的搜索用语词典来进行检索式的重新创建。
现有技术文献
专利文献
专利文献1:日本特开平5-128158号公报
发明内容
发明要解决的问题
在上述那样的信息搜索装置中,构成为,基于由自然文本构成的搜索文本创建搜索式,然而搜索式中包含的关键词和运算符会根据用户询问的回答结果进行适当变更。
例如,信息搜索装置在用户判断为搜索结果的回答件数少的情况下,参照搜索用语词典(并行地)追加关键词,或者进行上位化来替换关键词,将运算符从“AND”变更为“OR”,重新创建能够获得较多的回答件数的搜索式。
在这样的信息搜索装置中,在对不习惯搜索文本的创建的用户进行辅助的意义上是有效的,然而另一方面,存在无法正确表达自然文本中包括的搜索的真实意图或细微差别的情况。
此外,目前,在一般使用的互联网的搜索引擎中,例如,当用户输入“華々しくない(不华丽的)”或“彩りが良くない(色彩不好)”这样的搜索词时,分别使用“華々しい(华丽的)”或“彩り(色彩)”这样的关键词进行搜索,有时会排除由用户输入的搜索词的否定性的含义。
即使在这样的互联网搜索引擎中,如上所述,也存在无法正确表达自然文本中包括的搜索的真实意图或细微差别的情况。
因此,本发明的目的在于提供一种能够基于用户输入的自然文本自动地生成合适的搜索文本的搜索文本生成***。
此外,本发明的目的在于提供一种搜索文本生成***,其能够基于用户输入的自然文本,生成反映了自然文本中包括的搜索的真实意图和细微差别的搜索文本。
用于解决问题的手段
本发明提供如下的搜索文本生成***和搜索文本生成方法。
根据本发明的第一实施方式的发明具有以下结构。
一种搜索文本生成***(例如,搜索文本生成***11),其具有:
输入文本接收单元,接收用户输入的自然文本的输入文本;
输入文本分析单元,分析所述输入文本,并将其分割成多个词;
判定单元,基于所述多个词,判定与运算符(例如,AND和NOT)相对应的词(例如,“で(以、且、在)”和“以外の(以外的)”),并判定与所判定的所述词相关联的目标词;以及
搜索文本生成单元,使用与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组来生成与所述输入文本相对应的搜索文本。
根据本发明的这样的结构,能够基于用户输入的自然文本自动地生成合适的搜索文本,并且,用户即使在不习惯搜索文本的创建或不具有搜索式的知识的情况下,也可以在不创建复杂的搜索文本的情况下获得期望的搜索结果。
根据本发明的第二实施方式的发明在第一实施方式中具有以下结构。
所述判定单元构成为,基于预定的判定基准来判定与否定的逻辑运算的运算符相对应的词(例如,在解析后的输入文本中提取了“以外の(以外的)”或“ない(不是)”这样的词的情况下,运算符“NOT”与该词相关联)。
根据本发明的这样的结构,即使在用户的输入文本包括否定性条件的情况下,也可以获得期望的搜索结果。
根据本发明的第三实施方式的发明在第一实施方式中具有以下结构。
所述搜索文本生成单元构成为,基于与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组中各方的运算符与目标词之间的关系,以基于预定运算符的逻辑运算的优先级被决定的方式,生成所述搜索文本(例如,在图8中的(B)中,在生成搜索文本364的“服(衣服)NOT青(蓝色)”和部分搜索文本363的(3)的“服(衣服)AND”的情况下,两者的目标词“服(衣服)”是共同的,在搜索文本364中,由于“服(衣服)”处于以运算符“NOT”和目标词“青(蓝色)”修饰的关系,因而两者以“服(衣服)”汇总,并且,生成搜索文本365的“(服(衣服)NOT青(蓝色))AND”)。
根据本发明的这样的结构,能够基于用户输入的自然文本,自动地生成合适的搜索文本。
根据本发明的第四实施方式的发明在第一实施方式中具有以下结构。
所述判定单元构成为,针对所述多个词,依次判定与运算符相对应的词(例如,在图7的步骤S54中,根据输入文本的分析结果,依次取得与运算符相对应的词),
所述搜索文本生成单元构成为,每次判定出与所述运算符相对应的词时,就生成关于所判定的所述词的搜索文本,并将所述搜索文本与已生成的搜索文本集成(例如,图7的步骤S56)。
根据本发明的这样的结构,能够基于用户输入的自然文本,自动地生成合适的搜索文本。
根据本发明的第五实施方式的发明具有以下结构。
一种搜索文本生成方法,其在搜索文本生成服务器中被执行,所述搜索文本生成服务器基于用户输入的自然文本的输入文本来生成搜索文本,所述搜索文本生成方法的特征在于,具备:
输入文本接收步骤,接收所述输入文本;
输入文本分析步骤,分析所述输入文本,并将其分割成多个词;
判定步骤,基于所述多个词,判定与运算符相对应的词,并判定与所判定的所述词相关联的目标词;以及
搜索文本生成步骤,使用与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组来生成与所述输入文本相对应的搜索文本。
根据本发明的这种结构,能够基于用户输入的自然文本,自动地生成合适的搜索文本,并且,用户即使在不习惯搜索文本的创建或不具有搜索式的知识的情况下,也可以在不创建复杂的搜索文本的情况下获得期望的搜索结果。
发明的效果
利用根据本发明的搜索文本生成***,能够基于用户输入的自然文本,自动地生成合适的搜索文本,并且,用户可以在不创建复杂的搜索文本的情况下,通过如在通常的会话中询问那样的输入来获得期望的搜索结果。
此外,利用根据本发明的搜索文本生成***,能够基于用户输入的自然文本,生成反映了自然文本中包括的搜索的真实意图和细微差别的搜索文本,由此,用户即使在不习惯创建搜索文本、或不具有搜索式的知识的情况下,也可以不创建复杂的搜索文本而获得期望的搜索结果。
附图说明
图1是示出包括根据本发明的第一实施方式的搜索文本生成***的信息提供***的概要的图。
图2是例示出图1的信息提供***中的响应文本输出处理的流程图。
图3是例示出根据本发明的第一实施方式的搜索文本生成***的搜索文本生成处理的流程图。
图4是例示出图1的信息提供***中的用户终端中的对话画面的图形用户界面的图。
图5是例示出根据本发明的第一实施方式的搜索文本生成服务器的搜索文本生成处理的概要的图。
图6是示出根据本发明的第一实施方式的搜索文本生成服务器的搜索文本生成例的图。
图7是例示出根据本发明的第二实施方式的搜索文本生成服务器的搜索文本生成处理的流程图。
图8是例示出根据本发明的第二实施方式的搜索文本生成服务器的搜索文本生成处理的概要的图。
图9是示出构成与本发明的信息提供***相关联的用户终端的计算机的硬件结构的示例的图。
图10是示出构成本发明的搜索文本生成***中包括的搜索文本生成服务器的计算机的硬件结构的示例的图。
具体实施方式
首先,参照附图对包括根据本发明的第一实施方式的搜索文本生成***11的信息提供***1进行说明。
图1是示出通过提供与用户的输入相对应的响应来实现与用户的对话的信息提供***1的概要的图。信息提供***1构成为包括根据本发明的第一实施方式的搜索文本生成***11。
用户10在由在用户终端100中执行的WEB浏览器显示的预定WEB页面的输入区域中,(例如,使用用户终端100的键盘或触摸面板)输入字符串。这里,由用户10输入的字符串通常是用于对搜索目标执行信息搜索的搜索文本,是以自然语言表达的自然文本。
这里,以用户10输入关于这样的信息检索的自然文本为前提,之后,将来自用户的输入表达为“输入文本”。但是,该输入文本只要能够用于搜索,则可以不是文章的形式。此外,也无需是“苦くない薬は何?(什么是不苦的药?)”这样的提问文本或疑问形式。例如,可以接受“苦くない薬(不苦的药)”这样的构成提问文本的一部分的输入文本等各种形式的输入文本。
用户10以对话形式与信息提供***1进行交换,并且,作为针对用户10输入的输入文本的响应,基于该输入文本所执行的搜索的搜索结果显示在用户终端100上。
另外,在本实施方式中,在用户终端100上执行的WEB浏览器构成为显示用于输入输入文本的输入区域、搜索结果,但是在用户终端100上执行的其他应用也可以进行上述的输入区域、搜索结果的显示。
接下来,由用户10从用户终端100输入的输入文本,通过用户终端100的WEB浏览器经由网络500提供给信息提供***1。这里,网络500例如是包括互联网的网络。
信息提供***1构成为包括信息提供服务器200和搜索文本生成***11。此外,搜索文本生成***11包括搜索文本生成服务器300,并且,搜索文本生成服务器300具有用于分析输入文本的分析用数据340。
信息提供***1的信息提供服务器200在从用户终端100接收到输入文本时,将该输入文本发送到搜索文本生成***11,并从搜索文本生成***11接收在其中所生成的搜索文本。在搜索文本生成***11中,当接收到输入文本时,搜索文本生成服务器300参照分析用数据340等,基于接收到的输入文本生成搜索文本。
信息提供***1的信息提供服务器200在从搜索文本生成***11接收到所生成的搜索文本时,使用该搜索文本,执行对搜索目标数据400的搜索,并将搜索结果发送到用户终端100。
在本实施方式中,搜索目标数据400是配置在信息提供***1的外部的数据库等,但是也可以是信息提供***1具有的数据。此外,搜索目标数据400也可以是例如存储关于经由互联网可访问的资源的索引信息的数据库。通过搜索这样的数据库,可以在用户终端100上显示与搜索文本的条件匹配的WEB页面的列表、WEB页面的链接信息、各个WEB页面的内容等。
此外,搜索目标数据400也可以构成为包括企业提供的商品、该商品的库存信息等。这样,搜索目标数据400可以由各种内容构成。
这里,在信息提供***1作为可供不特定的用户利用的信息提供***被提供的情况下,作为用户10,可设想浏览WEB页面的普通用户、对提供WEB网站的企业或组织(的商品或服务等)进行提问等的普通用户等,并且,用户终端100可设想通常能够连接到互联网等的用户10所拥有的智能电话、PC(个人计算机)等。
另外,在图1中,构成为用户10在WEB站点的输入区域中输入输入文本(例如,使用用户终端100的键盘或触摸面板),并将其发送到信息提供***1,然而作为信息提供***1,也可以通过任何方法/途经来接收该输入文本。例如,在用户10通过语音发出关于搜索的提问的情况下,可以对该语音实施语音识别处理并将其转换成字符串,并将该转换后的字符串作为输入文本提供给信息提供***1。此外,还可以考虑通过OCR(Optical CharacterRecognition,光学字符识别)将所打印的关于搜索的提问事项等转换成字符串,并将该转换后的字符串作为输入文本提供给信息提供***1。
此外,来自信息提供***1的响应文本不仅通过表示搜索结果的字符信息,还可以通过图形、语音、视频等各种方法/途经提供给用户终端100。
另外,本实施方式的信息提供服务器200还具有这样的WEB服务器的功能:通过在用户终端100中执行的WEB浏览器和http等的协议进行数据发送和接收,并且,进行动作,使得在该WEB浏览器上显示预定的WEB页面。
此外,尽管在此将信息提供服务器200和搜索文本生成服务器300分别示为一台计算机,但是也可以构成为利用多台计算机分散执行相同的功能。此外,也可以将信息提供服务器200和搜索文本生成服务器300进行集成并由一台计算机实现。
此外,尽管在图1中示出了将根据本发明的第一实施方式的搜索文本生成***11并入上述的信息提供***1中的示例,但是也能够将搜索文本生成***11使用于其他的各种***中。搜索文本生成***11是接收至少一部分是自然文本的关于搜索的输入文本,并基于该输入文本生成合适的搜索文本的***。
图2是示出根据本实施方式的信息提供***1中的响应文本输出处理的流程的流程图。如上所述,该处理控制成使信息提供服务器200基于用户10输入的输入文本来搜索搜索目标数据400的内容,并将搜索结果显示在用户终端100上。
首先,在步骤S11中,信息提供服务器200判定是否从用户终端100接收到用户10的输入文本。在未接收到输入文本的情况下(步骤S11的“否”),重复该判定处理,在接收到输入文本的情况下(步骤S11的“是”),进入步骤S12。
在步骤S12中,信息提供服务器200将从用户终端100接收到的用户10的输入文本发送到搜索文本生成服务器300,并在此生成基于输入文本的搜索文本。
接下来,在步骤S13中,从搜索文本生成服务器300接收所生成的搜索文本,在步骤S14中,根据搜索目标数据400的数据管理***来调整所接收的搜索文本的形式。例如,在搜索文本生成服务器300中,以预定形式生成搜索文本,但是在搜索目标数据400的数据管理***为接受与搜索文本生成服务器300的形式不同的形式的搜索文本的规格的情况下,与其相应地,变更所生成的搜索文本的格式。例如,在商用数据库中,有时需要以包括SELECT文本的SQL格式构成搜索文本,有时也需要构成为用于在互联网的搜索引擎中利用的搜索文本。
接下来,在步骤S15中,使用调整后的搜索文本,对搜索目标数据400的内容进行搜索,并取得搜索结果。搜索结果例如是满足搜索文本的条件的项目列表、和针对表示各项目的详细内容的数据的链接信息。在搜索目标数据400是用于存储与能够经由互联网访问的资源有关的索引的数据库的情况下,搜索结果例如是满足搜索文本的条件的WEB页面的列表、和针对各WEB页面的链接信息。
接下来,在步骤S16中,信息提供服务器200对接收到的搜索结果进行编辑。例如,在用户终端100通过WEB浏览器发送了用户10的输入文本的情况下,(以html语言等)编辑构成为显示搜索结果的内容的WEB页面,之后,在步骤S17中,控制成将该编辑后的搜索结果输出到用户终端100。
图3是示出由根据第一实施方式的搜索文本生成服务器300执行的搜索文本生成处理的流程的流程图。该处理如上所述,在从信息提供服务器200接收到用户10的输入文本的情况下,基于该输入文本根据预定规则生成搜索文本,并将所生成的搜索文本发送到信息提供服务器200。
首先,在步骤S31中,搜索文本生成服务器300判定是否从信息提供服务器200接收到用户10的输入文本。在未接收到输入文本的情况下(步骤S31的“否”),重复该判定处理,在接收到输入文本的情况下(步骤S31的“是”),进入步骤S32。
在步骤S32中,搜索文本生成服务器300对接收到的输入文本进行分析,并从该输入文本中提取多个词。在本实施方式中,使用分析用数据340中包括的词素数据库来进行词素分析。由此,输入文本被分割成具有含义的最小单位(词素)。例如,各个词被分类成名词、动词、助词、助动词、形容词等的词类来提取(分割)。另外,在本实施方式中,尽管构成为进行词素分析,然而,可以通过进行与预定的关键词或字符串模式的对照的分析、或进行与词典中登记的词的比较的分析等采用各种方法进行输入文本的分析,来提取多个词。
此外,此时,删除或调整与所生成的搜索文本的结构不直接相关的词。例如,在“苦くない薬は何?(什么是不苦的药?)”这样的输入文本的情况下,由于“は(是)”、“何(什么)”、“?”等未反映在搜索文本中,因而在该阶段被删除。此外,根据需要,名词、形容词等被转换成适合在搜索文本中使用的形式(文体)。
接下来,在步骤S33中,根据输入文本的分析结果(分割后的词),判定与搜索文本中包括的运算符相对应的词。此外,此时,判定与对应于该运算符的词相关联的目标词。这里,目标词是表示在使用运算符的运算中需要的要素的词,是与被判定为与运算符相对应的词(基本上)相邻的名词或形容词等。目标词在搜索文本中可以定义为搜索目标数据400的搜索目标项目或搜索值。
例如,在从输入文本的一部分中提取“以外(以外)”、“の(的)”这样的连续的词素的情况下,将该两个词集成得到的“以外の(以外的)”的词也考虑到由相邻的(例如,前後の(前后的))名词等组成的目标词,之后,判定为与逻辑运算的NOT相对应。另外,在从输入文本的一部分中提取“で(以、且、在)”这样的词素的情况下,“で(以、且、在)”的词也考虑到由相邻的名词等组成的目标词,之后,判定为与逻辑运算的AND相对应。
另外,在本实施方式中,根据需要,参照分析用数据340,判定形容词是否为否定形,判定与运算符相对应的词,作为结果,可以在搜索文本中包括NOT,或者可以基于与词相邻的目标词的种类(例如,词类的种类)判定该词与哪个逻辑运算的运算符相对应。
利用这样的本发明的结构,无需单纯地提取输入文本中的特定字符串并将其与运算符相关联,就可以正确地提取输入文本的真实意图或细微差别并将其反映在搜索文本中。例如,在现有技术中,运算符的“AND”与输入文本的“と(与)”的字符串单纯相关联,或者“華々しくない(不华丽的)”这样的搜索词中的否定含义未反映在搜索文本中,然而在本发明中,如上所述,从通过输入分析被分割成多个的词中,判定与运算符相对应的词和与该词相关联的目标词,考虑相关联的目标词来进行运算符自身的判定,其结果,输入文本的真实意图或细微差别正确地反映在搜索文本中。
接下来,在步骤S34中,根据步骤S32的输入文本的分析结果和在步骤S33中所判定的运算符来决定搜索文本的框架。搜索文本框架定义了搜索文本的架构,并由搜索文本中的括号的配置(搜索式的评估顺序)、运算符、以及变量(在后面配置目标词)构成。
接下来,在步骤S35中,基于步骤S32的输入文本的分析结果,将相对应的目标词配置在搜索文本的框架中包括的变量的位置,将变量替换为目标词,生成最终的搜索文本。
接下来,在步骤S36中,将所生成的搜索文本发送到信息提供服务器200。
如上所述,在根据第一实施方式的搜索文本生成服务器300中,对接收到的输入文本进行解析,判定与运算符相对应的词,决定搜索文本的框架,之后,将该搜索文本的框架的变量部分替换为目标词,完成最终的搜索文本。利用这样的搜索文本生成方法,能够基于用户输入的自然文本,生成反映了自然文本中包括的搜索的真实意图或细微差别的搜索文本。
另外,后面参照图5对关于根据第一实施方式的搜索文本生成服务器300中的搜索文本生成的更具体的方法进行详细说明。
图4示出了在用户终端100的显示器上显示的对话画面120的图形用户界面(GUI)的一例。在对话画面120上示出了角色显示部121和输入响应显示部122。在角色显示部121中显示例如对应于用户10的输入文本的输入或搜索结果的显示而改变表情或动作的客服的角色。在输入响应显示部122中显示用户10输入到用户终端100的自然文本的输入文本。
另外,在输入响应显示部122中,作为客服响应,示出了指示正在执行基于输入文本的搜索的消息和基于输入文本所生成的搜索文本。之后,在其下部,作为客服响应,显示了从信息提供***1发送的与输入文本相对应的搜索结果。
此外,如图4所示,作为来自信息提供***1的搜索结果,示出了用于显示搜索命中件数和搜索结果的详细信息的链接按钮122a。例如,当用户10按下(或触摸)链接按钮122a时,用户终端100的显示转变为显示搜索结果的详细信息的另一WEB页面。在该WEB页面上,例如显示满足搜索文本的条件的项目列表、和针对表示各项目的详细内容的数据的链接信息。
图5是使用成为示例的输入文本350对由根据第一实施方式的搜索文本生成服务器300执行的搜索文本生成处理进行更详细的说明的图。
如图5中的(A)所示,搜索文本生成服务器300从用户10接收“青以外の服でS社製(蓝色以外的衣服且S公司制造)”的输入文本350,并对该输入文本350执行词素分析(参照图3的步骤S32)。在图5中的(A)中,词素分析的结果被示出为分析结果351。
通过词素分析,将输入文本350分解成例如“青(蓝色)”、“以外(以外)”、“の(的)”、“服(衣服)”、“で(且)”、“S社(S公司)”、“製(制造)”的各词。这里,例如,“青(蓝色)”、“以外(以外)”、“服(衣服)”、“S社(S公司)”的词分别被判定为名词,“の(的)”、“で(且)”的词分别被判定为助词(格助词),“製(制造)”的词被判定为后缀。另外,“S社(S公司)”的词通过分析用数据340中包括的专有名词词典被判定为表示公司名的名词。
接下来,进行针对与运算符相对应的词和目标词的判定(参照图3的步骤S33)。首先,从分析结果351中提取作为名词的“以外(以外)”和助词的“の(的)”,该两个词(例如,通过参照分析用数据340)通过连结而被判定为与运算符“NOT”相对应。如果自然文本为“P2以外のQ2(P2以外的Q2)”,则搜索式构成为“Q2 NOT P2”(图5中的(A)的附图标记353)。在这样的结构中,Q2和P2被判定为与“以外の(以外的)”的词相关联的目标词。在该示例中,Q2是名词,P2是修饰Q2的名词或形容词。
接下来,从分析结果351中提取助词的“で(且)”,并且,该词对应于“AND”。如果自然文本为“P1でQ1(P1且Q1)”,则搜索式构成为“P1 AND Q1”(图5中的(A)的附图标记352)。在这样的结构中,Q1和P1被判定为与“で(且)”的词相关联的目标词。在该示例中,Q1是名词,P1是形容词性表达,并且,成为以“AND”连接的并列的关系。
这样,通过运算符和目标词的判定,从分析结果351中提取搜索式“Q2NOT P2”和“P1 AND Q1”,而集成这两个搜索式,搜索文本的框架354被决定为“(YNOT X)AND Z”(参照图3的步骤S34)。这里,根据分析结果351中包括的与运算符相对应的词(“以外の(以外的)”和“で(且)”)、和与该词相邻的(例如,前後の(前后的))目标词的配置关系和内容,“P1”和“Q2”对应于相同的名词“服(衣服)”,并且,“Q2”进一步被“P2”和运算符“NOT”修饰。
其结果,由于“P1”与“Q2 NOT P2”相关联,因而搜索文本的框架354首先成为“(Q2NOT P2)AND Q1”。这里,检索式“Q2 NOT P2”随着“P1”与“Q2 NOT P2”相关联而以括号并入,在最终生成的搜索文本中,使该括号中的逻辑运算优先。另外,即使逻辑运算的优先级高,也不一定先执行该逻辑运算。这是因为,在解释搜索文本的搜索引擎等中,有可能被扩展为具有相同含义的另一搜索式。
之后,通过用Q2=Y、P2=X、Q1=Z替换,决定上述的“(YNOT X)AND Z”(另外,上述的用X、Y、Z进行的替换只不过是为了使说明易于理解)。
接下来,如图5中的(B)所示,当基于分析结果351应用上述的X、Y、Z时,X=“青(蓝色)”,Y=“服(衣服)”,Z=“S社製(S公司制造)”,最终生成的搜索文本355成为“(服(衣服)NOT青(蓝色))ANDS社製(S公司制造)”。
另外,在分析结果351中所分解的名词的“青(蓝色)”可以转换成(例如,使用分析用数据340中包括的同义词词典等获得)对应的形容词的连体形“青い(蓝色的)”。此外,这里,使在分析结果351中所分解的名词“S社(S公司)”和后缀“製(制造)”集成而得到的形容词性表达“S社製(S公司制造)”与上述的Z相关联,然而也可以使名词“S社(S公司)”与Z相关联。
通过以上的搜索文本生成处理,基于用户10输入的“青以外の服(蓝色以外的衣服)で(且)S社製(S公司制造)”这样的与搜索有关的输入文本,生成“服(衣服)NOT青(蓝色)AND S社製(S公司制造)”这样的搜索文本355。
利用这样的本发明的结构,可以正确地提取输入文本的真实意图或细微差别并将其反映在搜索文本中,而不使输入文本中的特定的字符串仅与运算符相关联。
图6是关于参照图5所说明的搜索文本生成处理,汇总了各种情况的图。基于在输入文本中所判定的词或与该词相邻的词来决定运算符和目标词,并最终生成搜索文本。但是,本发明的搜索文本生成处理不限于这里列举的情况。
情况1的示例与逻辑运算“NOT”的运算符有关,并且,该运算符表示“否定”。输入文本的示例是“苦くない薬(不苦的药)”的情况下,通过词素分析,目标词的“苦く(苦的)”的词被判定为形容词(连用形),“ない(不)”的词被判定为形容词(辅助形容词),目标词的“薬(药)”的词被判定为名词。这里,与运算符相对应的词是“ない(不)”。在该情况下,“ない(不)”的词被判断为具有否定形容词“苦く(苦的)”的含义,该词被判定为与运算符“NOT”相对应。之后,“薬(药)”和形容词“苦く(苦的)”的终止形词“苦い(苦的)”被选择为目标词,生成“薬(药)NOT苦い(苦的)”这样的搜索文本。
情况3的示例与逻辑运算“OR”的运算符有关,该运算符表示“逻辑或”。在输入文本的示例是“赤いもしくは青い服(红色的或蓝色的衣服)”的情况下,通过词素分析,目标词的“赤い(红色的)”的词被判定为形容词,“もしくは(或)”的词被判定为连接词,目标词的“青い(蓝色的)”的词被判定为形容词。这里,与运算符相对应的词是“もしくは(或)”。在这种情况下,“もしくは(或)”的词如上所述被判断为意味着逻辑或,并且,该词被判定为与运算符“OR”相对应。
这里,例如,生成部分搜索文本“赤い(红色的)OR”、“OR青い(蓝色的)”、“青い(蓝色的)AND服(衣服)”,将这些部分搜索文本集成,生成最终的搜索文本(另外,这里,在输入文本“青い服(蓝色的衣服)”中,“青い(蓝色的)”和“服(衣服)”是目标词,与运算符相对应的词成为修饰“服(衣服)”的“青い(蓝色的)”)。此外,上述的部分搜索文本“青い(蓝色的)AND服(衣服)”用运算符“AND”和目标词“青い(蓝色的)”修饰目标词的“服(衣服)”,并且,在与将部分搜索文本“赤い(红色的)OR”和“OR青い(蓝色的)”集成得到的搜索文本“赤い(红色的)OR青い(蓝色的)”集成的情况下,“赤い(红色的)OR青い(蓝色的)”用括号并入,使得在逻辑运算中优选。这种搜索文本中的括号的利用是根据与运算符相对应的词和与该词相邻的目标词的配置关系和内容来判断的。
情况2、情况4至情况6的示例也与逻辑运算的运算符有关,并且,与情况1一样,基于输入文本中包含的与运算符相对应的词来组成搜索文本。这里,省略详细的说明。
情况7的示例与比较运算“==”的运算符有关,该运算符表示“等于”。例如,在输入文本是“価格が1万円(价格是1万日元)”的情况下,与运算符相对应的词是助词(格助词)的“が(是)”。在该情况下,输入文本通过词素分析被分割成“価格(价格)”、“が(是)”,“1”、“万(万)”、“円(日元)”,通过与对应于运算符的“が”的词相邻配置“価格(价格)”的词和表示数量的“1万”(这里,数词和表示单位的数词被结合),判定为“が(是)”的词与运算符“==”相对应。之后,“価格(价格)”被转换为“price(价格)”,“1万”被转换为“10000”,之后将各方选择为目标词,并生成“price==10000”这样的搜索文本。
情况7至情况12的示例也与比较运算的运算符有关,并且,与情况6一样,基于输入文本中包括的与运算符相对应的词来组成搜索文本。这里,省略详细的说明。
此外,可以组合多个逻辑运算和多个比较运算来进行搜索。例如,在输入文本是“苦くない錠剤の薬(不苦的片剂的药)”的情况下,搜索文本可以生成为“薬(药)AND錠剤(片剂)NOT苦い(苦的)”。
另外,可以组合多个逻辑运算和比较运算来进行搜索。例如,在输入文本是“価格が1万円以下の赤い服(价格在1万日元以下的红色衣服)”的情况下,搜索文本可以生成为“服(衣服)AND赤い(红色的)AND価格(价格)<=10000”。
图7是示出由根据本发明的第二实施方式的搜索文本生成服务器300'执行的搜索文本生成处理的流程的流程图。搜索文本生成服务器300'在图1所示的信息提供***1中可以代替根据本发明的第一实施方式的搜索文本生成服务器300来配置。
在搜索文本生成服务器300'中执行的搜索文本生成处理与搜索文本生成服务器300的搜索文本生成处理一样,在从信息提供服务器200接收到用户10的输入文本的情况下,基于该输入文本,根据预定的规则生成搜索文本,并将所生成的搜索文本发送到信息提供服务器200。
首先,在步骤S51中,搜索文本生成服务器300'判定是否从信息提供服务器200接收到用户10的输入文本。在未接收到输入文本的情况下(步骤S51的“否”),重复该判定处理,在接收到输入文本的情况下(步骤S51的“是”),进入步骤S52。
在步骤S52中,搜索文本生成服务器300'对接收到的输入文本进行分析,并从该输入文本中提取多个词。在本实施方式中,使用分析用数据340中包括的词素数据库来进行词素分析。由此,输入文本被分割成具有含义的最小单位(词素)。例如,各个词被分类成名词、动词、助词、助动词、形容词等的词类来提取(分割)。另外,在本实施方式中,尽管构成为进行词素分析,然而可以进行与预定的关键词的对照的分析、或进行与词典中登记的词的比较的分析等采用各种方法进行输入文本的分析,来提取多个词。
此外,此时,与搜索文本生成服务器300的情况一样,删除或调整与所生成的搜索文本的结构不直接相关的词。此外,根据需要,名词、形容词等被转换成适合在搜索文本中使用的形式(文体)。
接下来,在步骤S53中,判定在输入文本的分析结果(分割后的词)中是否存在未处理的词(与运算符相对应的词)。在不存在未处理的词的情况下(步骤S53的“NO”),由于搜索式的生成结束,因而在步骤S60中,将所生成的搜索文本发送到信息提供服务器200,并重复步骤S51的处理(判定是否从信息提供服务器200接收到用户10的输入文本的处理)。
在存在未处理的词的情况下(步骤S53的“是”),在步骤S54中,根据输入文本的分析结果(分割后的词),依次判定与搜索文本中包括的运算符相对应的词。例如,在从输入文本的一部分中提取“以外(以外)”、“の(的)”这样的连续的词素的情况下,将该两个词集成得到的“以外の(以外的)”的词也考虑到由相邻的名词等组成的目标词,之后,判定为与逻辑运算的NOT相对应。另外,在从输入文本的一部分中提取“で(且)”这样的词素的情况下,“で(且)”的词也考虑到由相邻的名词等组成的目标词,之后,判定为与逻辑运算的AND相对应。
另外,在本实施方式中,根据需要,参照分析用数据340,判定形容词是否为否定形,判定与运算符相对应的词,作为结果,可以使搜索文本包括NOT,或者可以基于与词相邻的目标词的种类,判定该词与哪个逻辑运算的运算符相对应。
接下来,在步骤S55中,根据步骤S52的输入文本的分析结果和在步骤S54中所判定的一个运算符,判定与该运算符相对应的目标词。这里,目标词是与被判定为与运算符相对应的词相邻的名词或形容词等,并且,在搜索文本中,相当于搜索目标数据400的搜索目标项目或搜索值。
接下来,在步骤S56中,基于在步骤S54中所判定的一个运算符和在步骤S55中所判定的目标词,生成/集成搜索文本。另外,由于在输入文本的分析结果(分割后的词)中存在未处理的词(与运算符相对应的词)期间重复步骤S54至S56,因而每当与运算符相对应的词出现时,搜索文本就与已生成的搜索文本依次集成。
接下来,在步骤S57中,判定是否还存在与在步骤S54中所判定的一个运算符相关联的目标词。在不存在目标词的情况下(步骤S57中的“否”),返回到步骤S53,判定在输入文本的分析结果(分割的词)中是否还存在未处理的词(与运算符相对应的词)。
在存在目标词的情况下(步骤S57的“是”),在步骤S58中,根据步骤S52的输入文本的分析结果和在步骤S54中所判定的一个运算符,判定与该运算符相对应的目标词,接下来,在步骤S59中,基于在步骤S54中所判定的一个运算符和在步骤S58中所判定的目标词,对搜索文本进行集成。在步骤S58之后,返回到步骤S57,判定是否还存在与在步骤S54中所判定的一个运算符相关联的目标词。
这样,在根据第二实施方式的搜索文本生成服务器300'中,分析接收到的输入文本并依次判定与运算符相对应的词,在每次判定运算符的目标词时,都基于该运算符和目标词来组成搜索文本,通过对与运算符相对应的所有词重复该处理,完成最终的搜索文本。利用这种搜索文本生成方法,能够基于用户输入的自然文本,生成反映了自然文本中包括的搜索的真实意图和细微差别的搜索文本。
图8是使用成为示例的输入文本360对由根据第二实施方式的搜索文本生成服务器300'执行的搜索文本生成处理进行更详细说明的图。
如图8中的(A)所示,搜索文本生成服务器300'从用户10接收“青以外の服でS社製(蓝色以外的衣服S且公司制造)”的输入文本360,并对该输入文本360执行词素分析(参照图7的步骤S52)。在图8中的(A)中,词素分析的结果被示出为分析结果361。
通过词素分析,将输入文本360分解成例如“青(蓝色)”、“以外(以外)”、“の(的)”、“服(衣服)”、“で(且)”、“S社(S公司)”、“製(制造)”的各词。这里,例如,“(青)蓝色”、“以外(以外)”、“服(衣服)”、“S社(S公司)”的词分别被判定为名词,“の(的)”、“で(且)”的词分别被判定为助词(格助词),“製(制造)”的词被判定为后缀。另外,“S社(S公司)”的词通过分析用数据340中包括的专有名词词典被判定为表示公司名的名词。
这里,进行针对成为搜索文本的运算符的最初的词的判定并取得(参照图7的步骤S54)。首先,从分析结果361中提取作为名词的“以外(以外)”和助词的“の(的)”,该两个词通过(例如,通过参照分析用数据340)连结而被判定为与运算符“NOT”相对应。接下来,从分析结果361中获得与该运算符“NOT”相对应的目标词,即与“以外の(以外的)”词相邻的(例如,前後の(前后的))词,并将其判定为目标词(参照图7的步骤S55)。
作为该处理结果,判定与运算符“NOT”相对应的词“以外の(以外的)”和与该“以外の(以外的)”的词相对应的目标词“青(蓝色)”,并且,在图8中的(A)的判定结果362中表示“青以外の(蓝色以外的)”的词组。另外,基于该“青以外の(蓝色以外的)”的词组,生成搜索文本“NOT青(蓝色)”(参照图7的步骤S56),并且,将该搜索文本表示为图8中的(A)的部分搜索文本363的(1)。
之后,判定是否还存在与“以外の(以外的)”的词相对应的目标词(参照图7的步骤S57),其结果,判定目标词“服(衣服)”,并且,在图8中的(A)的判定结果362中表示“以外の服(以外的衣服)”的词组。另外,基于该“以外の服(以外的衣服)”的词组,生成搜索文本“服(衣服)NOT”(参照图7的步骤S56),并且,该搜索文本表示为图8中的(A)的部分搜索文本363的(2)。
这里,另外,如图8中的(B)所示,集成部分搜索文本363的(1)和(2)(参照图7的步骤S56),并且,作为搜索文本364而生成“服(衣服)NOT青(蓝色)”。
之后,判定是否还存在与“以外の(以外的)”的词相对应的目标词(参照图7的步骤S57),其结果,由于目标词不存在,因而进行针对成为搜索文本的运算符的下一词的判定并取得(参照图7的步骤S54)。这里,从分析结果361中提取助词的“で(且)”,并且,“で(且)”的词对应于运算符“AND”。接下来,从分析结果361中获得与该运算符“AND”相对应的目标词,即与“で(且)”的词相邻的词,并将其判定为目标词(参照图7的步骤S55)。
作为该处理结果,判定与运算符“AND”相对应的词“で(且)”和与该“で(且)”的词相对应的目标词“服(衣服)”,并且,在图8中的(A)的判定结果362中表示“服(衣服)で(且)”的词组。另外,基于该“服(衣服)で(且)”的词组,生成搜索文本“服(衣服)AND”(参照图7的步骤S56),并且,该搜索文本表示为图8中的(A)的部分搜索文本363的(3)。
这里,另外,如图8中的(B)所示,集成部分搜索文本363的(1)、(2)、(3)(参照图7的步骤S56),并且,作为搜索文本365生成“(服(衣服)NOT青(蓝色))AND”。这样的集成处理是通过将图8中的(B)所示的搜索文本364和图8中的(A)所示的部分搜索文本363的(3)进行集成,以共同的目标词“服(衣服)”的部分汇总来执行。此外,这里,搜索文本364的“服(衣服)NOT青(蓝色)”是用运算符“NOT”和目标词“青(蓝色)”来修饰目标词的“服(衣服)”,并且,在与作为部分搜索文本的搜索文本“服(衣服)AND”集成的情况下,如上所述,“服(衣服)NOT青(蓝色)”用括号并入,使得在逻辑运算中优先。即,这样的在搜索文本中的括号的利用是根据与运算符相对应的词、以及与该词相邻的目标词的配置关系和内容来判断的。
之后,判定是否还存在与“で(且)”的词相对应的目标词(参照图7的步骤S57),其结果,判定目标词“S社(S公司)”和“製(制造)”,并且,在图8中的(A)的判定结果362中表示了“でS社製(且S公司制造)”词组。另外,在本实施方式中,在分析结果361中分别提取“S社(S公司)”和“製(制造)”作为词素,但是这里,为了使目标词成为形容词性表达,将“S社(S公司)”和“製(制造)”结合而成为“S社製(S公司制造)”。当然,也可以仅选择名词的“S社(S公司)”作为目标词。
另外,基于该“でS社製(且S公司制造)”的词组,生成搜索文本“AND S社製(S公司制造)”(参照图7的步骤S56),并且,该搜索文本表示为图8中的(A)的部分搜索文本363的(4)。
这里,另外,如图8中的(B)所示,集成部分搜索文本363的(1)至(4)(参照图7的步骤S56),并且,作为搜索文本366生成“(服(衣服)NOT青(蓝色))AND S社製(S公司制造)”。这样的集成处理是通过将图8中的(B)所示的搜索文本365和图8中的(A)所示的部分搜索文本363的(4)进行集成,以共同的运算符“AND”的部分汇总来执行。
之后,判定是否还存在与“で(且)”的词相对应的目标词(参照图7的步骤S57),作为其结果,由于目标词不存在,因而进行针对成为搜索文本的运算符的下一词的判定并取得(参照图7的步骤S54)。这里,由于根据分析结果361不存在与运算符相对应的未处理词,因而截止目前通过集成处理所生成的搜索文本366的“(服(衣服)NOT青(蓝色))AND S社製(S公司制造)”作为所生成的搜索文本被发送到信息提供服务器200(参照图7的步骤S60)。
另外,在由根据本发明的第二实施方式的搜索文本生成服务器300'执行的搜索文本生成处理中,如图7和图8所示,一次进行输入文本整体的分析(图7的步骤S52),之后,针对与运算符相对应的词一个一个地依次进行搜索文本生成处理(图7的步骤S53至S59),而在部分地进行输入文本的分析的同时提取与运算符相对应的词的情况下,也可以控制成每次都进行关于该词的搜索词生成处理。
接下来,参照图9,对构成根据本发明的实施方式的用户终端100的计算机的硬件结构的示例进行说明。用户终端100例如是智能电话这样的移动设备。然而,图9所示的用户终端100的结构只不过例示了其代表的结构。
用户终端100包括:CPU(Central Processing Unit,中央处理单元)101、存储器102、相机103、GPS控制部104、GPS用天线105、无线信号处理部106、无线通信用天线107、音频控制部108、麦克风109、扬声器110、显示控制部111、输入设备接口112、触摸屏113、非接触IC卡读取/写入器114、传感器115、辅助存储装置116、以及外部记录介质接口117。
CPU 101控制用户终端100的各构成要素的动作,并在OS的控制下执行各功能。
存储器102通常由RAM(随机存取存储器)构成。用于实现由CPU 101执行的各功能的程序在执行时被加载在存储器102中,并且存储器102临时存储有该程序所需的数据等。
相机103是内置在用户终端100中的小型摄像装置。GPS控制部104经由GPS用天线105从多个GPS接收信号,检查用户终端100的位置。
无线信号处理部106经由无线通信用天线107与移动电话基站进行通信,并控制与其他设备之间的通话数据的发送/接收、以及(经由互联网的)与其他终端之间的WEB页面和邮件数据的发送/接收。此外,无线信号处理部106使用无线通信用天线107在与无线LAN接入点之间实现利用无线LAN的通信,并进行经由互联网的数据发送/接收(这里,为了方便起见,假设无线信号处理部106和无线通信用天线107进行与移动电话基站之间的无线通信以及与无线LAN接入点之间的无线通信)。
音频控制部108控制麦克风109和扬声器110来实现利用无线通信的通话,另一方面,在应用中再现动态图像或音乐的情况下,控制成输出语音。
触摸屏113使用例如由LCD(Liquid Crystal Display,液晶显示器)等构成的显示装置显示信息,并使用电阻膜方式或静电电容方式等的触摸传感器检测用户用手指等触摸(按压)画面表面的位置。显示控制部111处理由CPU 101发出的描绘数据,并将例如WEB页面或动态图像等输出到触摸屏113的显示装置。在输入设备接口112中,触摸屏113的触摸传感器检测由用户进行的操作,并将其作为预定信号发送到CPU 101。
在嵌入有非接触IC芯片的卡被保持在用户终端100的预定位置处的情况下,非接触IC卡读取/写入器114基于CPU 101的指令,读取存储在该IC芯片中的数据、或将预定数据写入IC芯片。
传感器115是触摸屏113的触摸传感器以外的传感器,具有运动传感器、光学传感器、接近传感器等。
辅助存储装置116例如由被称为闪存的半导体存储器或硬盘构成。辅助存储装置116除了存储用于实现由CPU 101执行的各功能的程序以外,还存储各种数据。
外部记录介质接口117访问外部记录介质140并读取记录在其中的数据。外部记录介质140例如是便携式闪存。
接下来,参照图10,对构成根据本发明的第一实施方式的搜索文本生成服务器300的计算机的硬件结构的示例进行说明。然而,图10所示的搜索文本生成服务器300的结构只不过例示出其代表结构。另外,根据本发明的第二实施方式的搜索文本生成服务器300'、信息提供***1的信息提供服务器200等也可以采用这样的计算机的结构。
搜索文本生成服务器300包括:CPU 301、RAM 302、ROM(Read Only Memory,只读存储器)303、网络接口304、音频控制部305、麦克风306、扬声器307、显示控制器308、显示器309、输入设备接口310、键盘311、鼠标312、外部存储装置313、外部记录介质接口314、以及将这些构成要素相互连接的总线315。
CPU 301控制搜索文本生成服务器300的各构成要素的动作,并在OS的控制下,控制根据本发明的各功能的执行。
RAM 302临时存储有用于执行由CPU 301执行的各处理的程序、和这些程序在执行中使用的数据。ROM 303存储有在搜索文本生成服务器300的起动时被执行的程序等。
网络接口304是用于连接到网络320的接口。网络320例如是用于与信息提供服务器200连接的网络。
音频控制部305控制麦克风306和扬声器307以控制语音的输入/输出。显示控制器308是用于实际处理由CPU 301发出的绘制指令的专用控制器。显示器309是例如由LCD构成的显示装置。
输入设备接口310接收从键盘311或鼠标312输入的信号,并根据该信号模式将预定指令发送到CPU 301。
外部存储装置313例如是硬盘或半导体存储器之类的存储装置,并且,在该装置内记录有上述的程序、数据。
外部记录介质接口314访问外部记录介质330并读取记录在其中的数据。外部记录介质330例如是便携式的闪存等。由CPU 301执行并用于实现本发明的各功能的程序可以经由该外部记录介质接口314从外部记录介质330提供。此外,作为用于实现本发明的各功能的程序的其他流通形式,还可以考虑从网络上的预定服务器经由网络320和网络接口304存储到外部存储装置313或RAM 302内这样的路径等。
另外,到目前为止,针对包括根据本发明的第一实施方式的搜索文本生成服务器300、或根据本发明的第二实施方式的搜索文本生成服务器300'的搜索文本生成***11、以及包括该搜索文本生成***11的信息提供***1,在示出可以实施本发明的具体例的同时进行了说明,但是这些具体例只不过是用于说明本发明的一例,本发明的权利范围不限于这些具体例。可以利用除这些以外的各种方法和结构来实现本发明的技术思想。
附图标记说明
1 信息提供***
11 搜索文本生成***
100 用户终端
200 信息提供服务器
300 搜索文本生成服务器
300' 搜索文本生成服务器
340 分析用数据
400 搜索目标数据
500 网络
Claims (5)
1.一种搜索文本生成***,其特征在于,具备:
输入文本接收单元,接收用户输入的自然文本的输入文本;
输入文本分析单元,分析所述输入文本,并将其分割成多个词;
判定单元,基于所述多个词,判定与运算符相对应的词,并判定与所判定的所述词相关联的目标词;以及
搜索文本生成单元,使用与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组来生成与所述输入文本相对应的搜索文本。
2.根据权利要求1所述的搜索文本生成***,其特征在于,所述判定单元基于预定的判定基准来判定与否定的逻辑运算的运算符相对应的词。
3.根据权利要求1所述的搜索文本生成***,其特征在于,所述搜索文本生成单元基于与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组中各方的运算符与目标词之间的关系,以基于预定运算符的逻辑运算的优先级被决定的方式,生成所述搜索文本。
4.根据权利要求1所述的搜索文本生成***,其特征在于,
所述判定单元针对所述多个词,依次判定与运算符相对应的词,
每次判定出与所述运算符相对应的词时,所述搜索文本生成单元就生成关于所判定的所述词的搜索文本,并将所述搜索文本与已生成的搜索文本集成。
5.一种搜索文本生成方法,其在搜索文本生成服务器中被执行,所述搜索文本生成服务器基于用户输入的自然文本的输入文本来生成搜索文本,所述搜索文本生成方法的特征在于,具备:
输入文本接收步骤,接收所述输入文本;
输入文本分析步骤,分析所述输入文本,并将其分割成多个词;
判定步骤,基于所述多个词,判定与运算符相对应的词,并判定与所判定的所述词相关联的目标词;以及
搜索文本生成步骤,使用与所判定的所述词相对应的运算符、和被判定为与该词相关联的目标词组来生成与所述输入文本相对应的搜索文本。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-107217 | 2018-06-04 | ||
JP2018107217A JP7139157B2 (ja) | 2018-06-04 | 2018-06-04 | 検索文生成システム、及び検索文生成方法 |
PCT/JP2019/018693 WO2019235131A1 (ja) | 2018-06-04 | 2019-05-10 | 検索文生成システム、及び検索文生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112236768A true CN112236768A (zh) | 2021-01-15 |
CN112236768B CN112236768B (zh) | 2024-07-16 |
Family
ID=68770837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980037385.XA Active CN112236768B (zh) | 2018-06-04 | 2019-05-10 | 搜索文本生成***和搜索文本生成方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210263915A1 (zh) |
JP (1) | JP7139157B2 (zh) |
CN (1) | CN112236768B (zh) |
PH (1) | PH12020552089A1 (zh) |
WO (1) | WO2019235131A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102396881B1 (ko) * | 2021-08-18 | 2022-05-12 | 주식회사 비포플레이 | 콘텐츠 검색을 지원하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
JP2023036140A (ja) * | 2021-09-02 | 2023-03-14 | 株式会社日立製作所 | 業務データ分析装置、業務データ分析システム及び業務データ分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05128158A (ja) * | 1991-10-31 | 1993-05-25 | Nec Corp | 情報検索装置 |
JPH08339383A (ja) * | 1995-04-11 | 1996-12-24 | Ricoh Co Ltd | 文書検索装置及び辞書作成装置 |
JP2006073035A (ja) * | 1998-02-02 | 2006-03-16 | Ricoh Co Ltd | 電子化文書検索システム、検索装置、および記録媒体 |
CN102067124A (zh) * | 2008-06-18 | 2011-05-18 | 日立***解决方案有限公司 | 文档搜索*** |
CN102132274A (zh) * | 2008-08-26 | 2011-07-20 | 国际商业机器公司 | 使用了公开的搜索引擎的搜索装置、搜索方法以及搜索程序 |
CN104199965A (zh) * | 2014-09-22 | 2014-12-10 | 吴晨 | 一种语义信息检索方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11328194A (ja) * | 1998-05-13 | 1999-11-30 | Nippon Telegr & Teleph Corp <Ntt> | キーワード検索方法及び装置及びキーワード検索プログラムを格納した記憶媒体 |
US8775459B2 (en) * | 2005-01-07 | 2014-07-08 | International Business Machines Corporation | Method and apparatus for robust input interpretation by conversation systems |
US20070106499A1 (en) * | 2005-08-09 | 2007-05-10 | Kathleen Dahlgren | Natural language search system |
KR101023209B1 (ko) * | 2008-10-13 | 2011-03-18 | 한국전자통신연구원 | 문서 번역 장치 및 그 방법 |
RU2564629C1 (ru) * | 2014-03-31 | 2015-10-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Способ кластеризации результатов поиска в зависимости от семантики |
KR102033395B1 (ko) * | 2014-11-20 | 2019-10-18 | 한국전자통신연구원 | 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법 |
US11151249B2 (en) * | 2017-01-06 | 2021-10-19 | Crowdstrike, Inc. | Applications of a binary search engine based on an inverted index of byte sequences |
US11481387B2 (en) * | 2017-12-28 | 2022-10-25 | Microsoft Technology Licensing, Llc | Facet-based conversational search |
-
2018
- 2018-06-04 JP JP2018107217A patent/JP7139157B2/ja active Active
-
2019
- 2019-05-10 WO PCT/JP2019/018693 patent/WO2019235131A1/ja active Application Filing
- 2019-05-10 CN CN201980037385.XA patent/CN112236768B/zh active Active
- 2019-05-10 US US17/059,831 patent/US20210263915A1/en active Pending
-
2020
- 2020-12-04 PH PH12020552089A patent/PH12020552089A1/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05128158A (ja) * | 1991-10-31 | 1993-05-25 | Nec Corp | 情報検索装置 |
JPH08339383A (ja) * | 1995-04-11 | 1996-12-24 | Ricoh Co Ltd | 文書検索装置及び辞書作成装置 |
JP2006073035A (ja) * | 1998-02-02 | 2006-03-16 | Ricoh Co Ltd | 電子化文書検索システム、検索装置、および記録媒体 |
CN102067124A (zh) * | 2008-06-18 | 2011-05-18 | 日立***解决方案有限公司 | 文档搜索*** |
CN102132274A (zh) * | 2008-08-26 | 2011-07-20 | 国际商业机器公司 | 使用了公开的搜索引擎的搜索装置、搜索方法以及搜索程序 |
CN104199965A (zh) * | 2014-09-22 | 2014-12-10 | 吴晨 | 一种语义信息检索方法 |
Also Published As
Publication number | Publication date |
---|---|
US20210263915A1 (en) | 2021-08-26 |
WO2019235131A1 (ja) | 2019-12-12 |
CN112236768B (zh) | 2024-07-16 |
PH12020552089A1 (en) | 2021-08-02 |
JP2019211987A (ja) | 2019-12-12 |
JP7139157B2 (ja) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110678859B (zh) | 显示装置 | |
US20240078386A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN109196496B (zh) | 未知词预测器和内容整合的翻译器 | |
US8433709B2 (en) | Modular system and method for managing chinese, japanese and korean linguistic data in electronic form | |
US10102191B2 (en) | Propagation of changes in master content to variant content | |
US10380241B2 (en) | Modular system and method for managing chinese, japanese, and korean linguistic data in electronic form | |
US20100131534A1 (en) | Information providing system | |
WO2022134360A1 (zh) | 基于词嵌入的模型训练方法、装置、电子设备及存储介质 | |
WO2008145055A1 (fr) | Procédé pour obtenir une information de mot de restriction et pour optimiser le système du procédé d'entrée et de sortie | |
JP7297458B2 (ja) | 対話コンテンツ作成支援方法 | |
WO2020026366A1 (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
CN112236768B (zh) | 搜索文本生成***和搜索文本生成方法 | |
CN112416142A (zh) | 输入文字的方法、装置和电子设备 | |
US20100094615A1 (en) | Document translation apparatus and method | |
JP2020095653A (ja) | 作成支援装置および作成支援方法 | |
CN112149403A (zh) | 一种确定涉密文本的方法和装置 | |
TW202349325A (zh) | 一種語意分析商標類別推薦系統及其方法 | |
US20220083736A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN112988993A (zh) | 一种问答方法和计算设备 | |
JP2020021455A (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
KR102340404B1 (ko) | 언어 단위를 이용한 영화 추천 항목 관리 방법 및 장치 | |
JP2008134798A (ja) | 用語辞書作成補助装置、その方法およびプログラム | |
JP2005070864A (ja) | 情報推薦装置、情報推薦方法、コンピュータ、及び記録媒体 | |
JPH01185724A (ja) | 検索装置 | |
CN114936272A (zh) | 一种问答方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |