WO2014177118A1 - 查询选取方法及*** - Google Patents

查询选取方法及*** Download PDF

Info

Publication number
WO2014177118A1
WO2014177118A1 PCT/CN2014/080619 CN2014080619W WO2014177118A1 WO 2014177118 A1 WO2014177118 A1 WO 2014177118A1 CN 2014080619 W CN2014080619 W CN 2014080619W WO 2014177118 A1 WO2014177118 A1 WO 2014177118A1
Authority
WO
WIPO (PCT)
Prior art keywords
node
query
nodes
condition
user
Prior art date
Application number
PCT/CN2014/080619
Other languages
English (en)
French (fr)
Inventor
易峥
王进
夏炜
Original Assignee
浙江核新同花顺网络信息股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 浙江核新同花顺网络信息股份有限公司 filed Critical 浙江核新同花顺网络信息股份有限公司
Priority to US14/787,472 priority Critical patent/US10185772B2/en
Publication of WO2014177118A1 publication Critical patent/WO2014177118A1/zh
Priority to US16/252,819 priority patent/US10922371B2/en
Priority to US17/134,566 priority patent/US11714861B2/en
Priority to US18/335,097 priority patent/US20230325447A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the present invention relates to the field of processing technologies, and in particular, to a query selection method and system.
  • the prior art when querying data in a database or a data source, the prior art generally provides multiple query options (also referred to as query indicators or indicators). After the user selects the indicator, the constraint conditions corresponding to the indicator are also required to be configured. After all the constraints are combined with the logical relationship of "and" and "or", the system forms a query instruction, performs query screening in the database, and presents it to the user. In the prior art, users cannot query and filter data by inputting natural language statements.
  • the embodiment of the present invention provides a query selection method and system to solve the above problem.
  • the embodiment of the present invention provides the following technical solutions:
  • a query selection method based at least on a query selection system, comprising:
  • the query selection system obtains a natural language statement input by the user
  • the query selection system performs pre-processing on the natural language sentence input by the user to obtain a standard node sequence, where the node includes at least an indicator node and a condition node, and the condition node package Including at least one of a number node, a date node, and a string node;
  • the query selection system constructs a node tree according to the relationship between the indicator node and other nodes, and the node tree is used to represent the combination of index conditions;
  • the query selection system generates a data query instruction according to the node tree
  • the query selection system uses the data query instruction to query data, and filters the query result to obtain a screening result
  • the query selection system displays the screening results.
  • a query selection system including:
  • An acquisition unit for obtaining a natural language input by a user An acquisition unit for obtaining a natural language input by a user
  • a pre-processing unit configured to perform pre-processing on the natural language input by the user, to obtain a standard node sequence, where the node includes at least an indicator node and a condition node, where the condition node includes a digital node, a date node, and a string node At least one
  • a node tree construction unit configured to construct a node tree according to a relationship between the indicator node and other nodes, where the node tree is used to represent an indicator condition combination
  • a translation unit configured to translate the node tree into a data query instruction
  • a query screening unit configured to query data by using the data query instruction, and filter the query result to obtain a screening result
  • a display unit for displaying the screening result.
  • the query selection system automatically processes the natural language statement to form a node tree that represents the combination of the index conditions, and generates a data query according to the node tree.
  • the instruction, the query is filtered in the database, and displayed to the user, thereby realizing the user to input the natural language statement Query and filter data.
  • the user only needs to input natural language sentences, and no longer needs to select indicators and set restrictions. Therefore, the user operation is simplified, and the operation time of the user is saved.
  • FIG. 1 is a schematic structural diagram of a query selection system according to an embodiment of the present invention.
  • FIG. 2 is a flowchart of a method for selecting a query according to an embodiment of the present invention
  • FIG. 3 is another flowchart of a query selection method according to an embodiment of the present invention.
  • FIG. 4 is still another flowchart of a query selection method according to an embodiment of the present invention.
  • FIG. 5 is a schematic diagram of a node tree according to an embodiment of the present invention.
  • FIG. 6 is another schematic diagram of a node tree according to an embodiment of the present invention.
  • FIG. 7 is still another flowchart of a query selection method according to an embodiment of the present invention.
  • FIG. 8 is still another flowchart of a query selection method according to an embodiment of the present invention.
  • FIG. 9 is still another flowchart of a query selection method according to an embodiment of the present invention.
  • FIG. 10 is still another flowchart of a query selection method according to an embodiment of the present invention.
  • the prior art When querying data in a database or a data source, the prior art generally provides multiple query options (also referred to as query indicators or indicators). After the user selects the indicator, the user needs to configure the constraint corresponding to the indicator, and After all the constraints are combined with the logical relationship of "and" and "or", the system forms a query instruction, performs query screening in the database, and presents it to the user.
  • query indicators or indicators also referred to as query indicators or indicators.
  • the embodiment of the present invention provides a query selection method and a query selection system to solve the above problem.
  • the above query selection system may include at least an acquisition unit 1, a preprocessing unit 2, a node tree construction unit 3, a translation unit 4, a query screening unit 5, and a presentation unit 6.
  • the query selection method provided by the embodiment of the present invention includes at least the following steps:
  • the query selection system acquires a natural language statement input by the user; Users can enter natural language statements with handwriting, buttons, or voice. Therefore, the above-mentioned acquisition unit may specifically include a keyboard, a microphone (for voice input), a stylus and a touch screen (a stylus and a touch screen for handwriting input), and the like.
  • the query selection system pre-processing unit pre-processes the natural language sentences input by the user to obtain a standard node sequence (considering that a standard node sequence will also appear later, the standard node sequence obtained in step S2 may be referred to as a first standard) Node sequence).
  • the above node includes at least an indicator node and a condition node, and the condition node may further include at least one of a digital node, a date node, and a string node.
  • the query selection system constructs a node tree according to the relationship between the indicator node and other nodes, and the node tree is used to represent the combination of index conditions;
  • the query selection system (translation unit) generates a data query instruction according to the node tree
  • the query selection system uses the data query instruction to query the data, and filters the query result to obtain a screening result;
  • the query selection system displays the screening results.
  • the display unit can be a display screen.
  • the query selection system automatically processes the natural language statement to form a node tree that represents the combination of the index conditions, and generates a data query according to the node tree.
  • the instruction performs query filtering in the database and presents it to the user, thereby realizing the purpose of the user to query and filter the data by inputting a natural language statement.
  • the user only needs to input the natural language statement, and no longer needs to select the indicator and set the restriction condition. Therefore, the user operation is simplified, and the operation time of the user is saved. The details of steps S2 - S4 will be highlighted below.
  • step S2 will be introduced.
  • the foregoing step S2 may specifically include:
  • S21 Perform word segmentation processing on a natural language sentence input by the user to obtain a plurality of words or phrases;
  • At least one node is included in the original node sequence.
  • a node can be constructed for each word or phrase through a configuration dictionary, and the node type can include a question word node, an indicator node, a digital node, a date node, a logical word node, a string node, etc., and finally get a user input sentence.
  • the node type can include a question word node, an indicator node, a digital node, a date node, a logical word node, a string node, etc.
  • Both the above digital node and string node can be used as the constraint value of the indicator node.
  • "Li Ming” is a string node, which is the constraint value of the "name” indicator node; and in the "mathematical score over 90 points”
  • the "90 points” digital node is the conditional value of the "mathematical score” indicator node.
  • a specific system that is, in a specific application scenario
  • can provide query options that is, query indicators
  • the indicators that can be provided include grades, classes, and subjects (mathematics, language, geography, history, biology, etc.), which are fixed. Therefore, the words or words obtained by the index keywords can be used for the word segmentation.
  • the group is matched to determine the metrics contained in the statement entered by the user.
  • the logical words are also fixed.
  • the logical word dictionary can be pre-set.
  • the dictionary includes the logical keywords “and”, “and”, “and”, “simultaneous”, “and”, “or”, etc., using logic.
  • the keyword matches the word or phrase after the word segmentation to determine whether it is a logical relationship node.
  • the corresponding node sequence may be non-standard.
  • the above-mentioned “three-level five-class Li Ming's mathematics scores” is taken as an example. Only the phrase “Li Ming” appears in the sentence, but the "name” is omitted, so that the corresponding node sequence is only " Li Ming "this string node, and lacks its corresponding indicator node - "name”. Therefore, it is necessary to add the indicator node (name) to it and convert it into the standard node sequence "Mathematics of the third grade five-character name Li Ming".
  • the node sequence corresponding to the natural language statement input by the user may be converted into a standard node sequence that the node tree construction unit can process according to the configuration rule:
  • Keyword sinks can be represented by regular expressions.
  • step S2 further includes the step of performing character recognition on the voice input to obtain a text recognition result. This converts speech into text.
  • next step S3 is to construct a node tree based on the relationship between the indicator node and other nodes.
  • step S3 may specifically include:
  • the date node needs to be parsed and converted. Conversely, there is no need to parse the date node. For example, "this year” is not an accurate date range that computers can understand. If this year is 2013, it needs to be converted to the date node "2013".
  • the logical word nodes also need to be converted, for example, the logical word nodes "and”, “and”, “and”, “simultaneous", “and”, etc., are converted to "and” or "the logical word node” Or ", " or “convert to” or “.” By analogy, you can end up with a combination of indicator conditions.
  • each indicator node in the node tree corresponds to one condition node. Take "a stock with a year-on-year growth rate of more than 50% for three consecutive years", which is actually a combination of three indicator conditions:
  • the node tree corresponding to the “3 consecutive years of growth of more than 50% of stocks as an example” includes three “year-on-year growth rate” indicator nodes, and each indicator node corresponds to one conditional node.
  • step S4 may specifically include: Determining a data source corresponding to each indicator node in the node tree;
  • the corresponding indicator node and condition node are translated into query instructions that meet the requirements of the data source format.
  • each data source itself supports querying according to the index condition.
  • the embodiment of the present invention configures an instruction translation program for each data source for its unique query instruction format. And, in the embodiment of the present invention, the understanding of the semantics of the sentence input by the user is separate from the acquisition of the final data.
  • the filtering the query result in the foregoing step S5 may include: performing a merge operation and/or a filtering operation on the query result according to the relationship between the indicator nodes in the node tree. Specifically, after obtaining the query result, the data is merged and filtered according to the logical combination relationship between the indicators, and the query result that meets the combination of all the index conditions is retained.
  • filtering taking the node tree of Figure 6 as an example.
  • the "nodes with a year-on-year growth rate of more than 50% for three consecutive years” includes three "year-on-year growth rate" indicators. Node, each indicator node corresponds to a condition node.
  • the corresponding node tree includes three “year-on-year growth rate” indicator nodes, which can be used when generating query commands.
  • Three query instructions are generated according to the three indicator nodes respectively, and after the query result is obtained, the query result is filtered. It is also possible to generate a query instruction that satisfies the data of the three indicator condition values at the same time. At this time, it is no longer necessary to filter the query result.
  • the main reason is that different indicators correspond to different data sources. After obtaining the query results from multiple data sources, the query results can be combined.
  • step S6 the following steps may also be included:
  • the query selection system displays the combination of indicator conditions.
  • the above method may further include the following steps:
  • the query selection system obtains a condition change instruction input by the user. After the condition change instruction is acquired, the system changes the condition and regenerates the data query instruction.
  • the query selection system may include an instruction change unit, configured to acquire a condition change instruction input by the user, perform condition change, and regenerate the data query instruction.
  • Conditional changes can include conditional appends, conditional modifications, and conditional deletions.
  • the user can select an indicator to be added in a manner similar to the prior art, and configure the restriction condition corresponding to the indicator. Users can also add natural language conditions. A button or icon can be set, and when the user clicks, the instruction change unit is triggered.
  • step S10 it is necessary (step S10) to acquire a natural language sentence added by the user input (similar to step S1), (step S11) and pre-processing the additional natural language sentence to obtain a second standard node sequence (similar to step S2), (step S12)
  • step S3 regenerates the query instruction and proceeds to step S4 to re-query and filter.
  • step S13 directly modify or delete the corresponding node in the first standard node sequence, and proceed to step S3.
  • the query selection system can simultaneously provide the "condition append”, “condition modification”, and “condition delete” buttons to facilitate user operation.
  • step S7 may also occur before step S3, and the timing of the user changing the condition may also be selected before step S3 is performed.
  • step S2 the following steps may also be included:
  • the user inputs "major grades of five grades of Li Ming's mathematics” and converts them into a sequence of first standard nodes as "mathematical scores of subjects of the five grades of the grade three grades of Li Ming" and displays them.
  • step S3 is performed.
  • the query selection system can simultaneously provide the "confirmation”, “conditional addition”, “condition modification”, and “conditional deletion” buttons to facilitate user operation.
  • Step (1) The user enters the natural language statement "stocks whose net profit has increased by more than 50% for three consecutive years".
  • Step (2) gets the "original node sequence of "3 consecutive years I net profit I grow I exceed 50%
  • Step (3) parsing the digital node and the time node.
  • Step (4) construct a node tree.
  • the ">50%" digital node is used to bind the value of the "net profit (year-on-year growth rate)" filter, and the "three consecutive years” time node is bound to "net profit” (year-on-year).
  • Time parameter of growth rate
  • the time parameter is the annual feature
  • the "three consecutive years” are divided into “the most recent year”, “pre-push one year”, and “push two "Three annual time nodes, and other nodes are replicated, and finally a node tree characterizing the combination of three indicators is obtained (see Figure 6).
  • Step (5) combining the above index conditions to translate the data query instruction.
  • Step (6) execute the query command, and filter out all the non-eligible stocks according to the condition of net profit (year-on-year growth rate) >50%.
  • step (7) the stocks and related net profit (year-on-year growth rate) data are displayed on the interface, and the obtained index conditions are also displayed to the user, which is convenient for the user to check and verify.
  • Step (8) the user can choose to change the condition (that is, the aforementioned input condition change instruction), such as adding a condition "Zhejiang", so that "Zhejiang” can be selected for "continuous 3-year net profit growth of more than 50% stock".
  • the user will change the net profit (year-on-year growth rate) of the most recent year to more than 50% to less than 30%, etc., and then re-select the stock.
  • the technical solutions provided by the embodiments of the present invention can be used in the search field, the communication field, the industrial field, and the like.
  • a simple example is given.
  • the web server that is, the query selection system
  • steps S1 - S4 to convert the natural language sentence input by the user into a data query instruction, and then, the web server uses the data.
  • the query instruction performs a query to obtain a query result, and performs screening (step S5), and returns the screening result to the client display, and then completes a search.
  • the user inputs "call to Li Ming", and the mobile phone (that is, the query selection system) performs the steps S1 - S2, and converts the natural sentence input by the user into a standard node sequence "calling the contact” Li Ming", where "contact” is the indicator node and "Li Ming" is the string node.
  • steps S3 - S5 a data command is generated, the contact list of the mobile phone is queried, and the telephone number of "Li Ming" is found and displayed.
  • the above method may further include According to the screening result - "Li Ming" phone number, initiate a communication call.
  • the PLC that is, the query selection system
  • steps S1 - S2 the PLC will generate a data command.
  • query the current temperature value of the steelmaking production line and show the steelmaking production line will periodically upload the current temperature value to a certain database.
  • the above method may further include, the current temperature value of the steelmaking production line and "50 degrees” "Comparatively, if the former is lower than the latter, warming is performed. If the former is higher than the latter, the temperature is lowered.
  • the embodiment of the present invention further requires a query selection system.
  • the system may include at least:
  • the obtaining unit 1 is configured to obtain a natural language input by the user;
  • the preprocessing unit 2 is configured to preprocess the natural language input by the user to obtain a first standard node sequence, where the node includes at least an indicator node and a condition node, and the condition node includes at least one of a digital node, a date node, and a string node. ;
  • the node tree construction unit 3 is configured to construct a node tree according to the relationship between the indicator node and other nodes, and the node tree is used to represent the combination of the indicator conditions;
  • a translation unit 4 configured to translate the node tree into a data query instruction
  • the query screening unit 5 is configured to query data by using a data query instruction, and select the query result to obtain a result of the selection;
  • Display unit 6 is used to display the screening results.
  • Display unit 6 can also be used to display combinations of indicator conditions.
  • the query selection system may further include a change unit configured to acquire a condition change instruction input by the user to perform a condition change.
  • the change unit may include a condition appending unit, a condition modification/deletion unit.
  • the condition adding unit acquires the natural language sentence added by the user input, and preprocesses the added natural language sentence to obtain the second standard node sequence, and merges with the original first standard node sequence. After indicating the node tree construction unit
  • the condition modification/delete unit may modify or delete the corresponding node in the original first standard node sequence according to the modification or deletion operation of the user, and instruct the node tree construction unit 3 to regenerate the data query instruction.
  • the preprocessing unit, the node tree construction unit, the translation unit, the query screening unit, and the instruction modification unit in the query selection system may be hardware units, circuits, or logic units. Specifically, the functions of each unit are completed by the processor.
  • the steps of a method or algorithm described in connection with the embodiments disclosed herein can be implemented directly in hardware, a software module executed by a processor, or a combination of both.
  • the software module can be placed in random access memory (RAM), memory, read only memory (ROM), electrically programmable ROM, electrically erasable programmable ROM, registers, hard disk, removable disk, CD-ROM, or technical field. Any other form of storage medium known.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种査询选取方法和査询选取***,上述方法包括:査询选取***获取用户输入的自然语言语句,对其进行预处理,得到标准节点序列(节点至少包括指标节点和条件节点),并根据指标节点与其他节点之间的关系,构造节点树,节点树用于表征指标条件组合;根据节点树生成数据査询指令;査询选取***使用数据査询指令査询数据,并对査询结果进行筛选,得到筛选结果并展示。利用所述方法和***,在用户输入自然语言语句后,由査询选取***自动对自然语言语句进行处理,构成表征指标条件组合的节点树,并根据节点树生成数据査询指令,在数据库中进行査询筛选,并展示给用户,从而实现了用户通过输入自然语言语句来对数据进行査询和筛选。

Description

查询选取方法及*** 技术领域 本发明涉及加工技术领域,更具体的说, 涉及查询选取方法及***。
背景技术 在对数据库、 数据源中的数据进行查询时, 现有技术一般会提供多 个查询选项 (也可称为查询指标或指标) , 用户选择指标后, 还需要配 置指标对应的限制条件, 并将所有的限制条件以 "且"和"或"的逻辑关系 组合后, ***形成查询指令, 在数据库中进行查询筛选, 并展示给用户。 在现有技术中, 用户无法通过输入自然语言语句来实现对数据的查询和 筛选。
发明内容
有鉴于此, 本发明实施例提供了查询选取方法及***, 以解决上述 问题。
为实现上述目的, 本发明实施例提供如下技术方案:
一种查询选取方法, 至少基于查询选取***, 包括:
查询选取***获取用户输入的自然语言语句;
查询选取***对所述用户输入的自然语言语句进行预处理, 得到标 准节点序列, 所述节点至少包括指标节点和条件节点, 所述条件节点包 括数字节点、 日期节点、 字符串节点中的至少一种;
查询选取***根据指标节点与其他节点之间的关系, 构造节点树, 所述节点树用于表征指标条件组合;
查询选取***根据所述节点树生成数据查询指令;
查询选取***使用所述数据查询指令查询数据, 并对查询结果进行 筛选, 得到筛选结果;
查询选取***展示所述筛选结果。
一种查询选取***, 包括:
获取单元, 用于获取用户输入的自然语言;
预处理单元, 用于对所述用户输入的自然语言进行预处理, 得到标 准节点序列, 所述节点至少包括指标节点和条件节点, 所述条件节点包 括数字节点、 日期节点和字符串节点中的至少一种;
节点树构造单元, 用于根据指标节点与其他节点之间的关系, 构造 节点树, 所述节点树用于表征指标条件组合;
翻译单元, 用于将所述节点树翻译成数据查询指令;
查询筛选单元, 用于使用所述数据查询指令查询数据, 并对查询结 果进行筛选, 得到筛选结果;
展示单元, 用于展示所述筛选结果。
经由上述的技术方案可知, 在本发明实施例中, 在用户输入自然语 言语句后, 由查询选取***自动对自然语言语句进行处理, 构成表征指 标条件组合的节点树, 并根据节点树生成数据查询指令, 在数据库中进 行查询筛选, 并展示给用户, 从而实现了用户通过输入自然语言语句来 对数据进行查询和筛选。 此外, 用户只需要输入自然语言语句, 不再需 要选择指标、 设置限制条件, 因此, 还简化了用户操作, 节省了用户的 操作时间。
附图说明
对实施例或现有技术描述中所需要使用的附图作简单地介绍, 显而易见 地, 下面描述中的附图仅仅是本发明的实施例, 对于本领域普通技术人 员来讲, 在不付出创造性劳动的前提下, 还可以根据提供的附图获得其 他的附图。
图 1为本发明实施例提供的查询选取***结构示意图;
图 2为本发明实施例提供的查询选取方法流程图;
图 3为本发明实施例提供的查询选取方法另一流程图;
图 4为本发明实施例提供的查询选取方法又一流程图;
图 5为本发明实施例提供的节点树示意图;
图 6为本发明实施例提供的节点树另一示意图;
图 7为本发明实施例提供的查询选取方法又一流程图;
图 8为本发明实施例提供的查询选取方法又一流程图;
图 9为本发明实施例提供的查询选取方法又一流程图;
图 10为本发明实施例提供的查询选取方法又一流程图。
具体实施方式 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案 进行清楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实 施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术 人员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本 发明保护的范围。
在对数据库、 数据源中的数据进行查询时, 现有技术一般会提供多 个查询选项 (也可称为查询指标或指标) , 用户选择指标后, 还需要配 置指标对应的限制条件, 并将所有的限制条件以 "且"和"或"的逻辑关系 组合后, ***形成查询指令, 在数据库中进行查询筛选, 并展示给用户。
举例来讲, 用户如想查询数学成绩以及语文成绩均超过 80分的学 生, 至少需要选择 "数学成绩"、 "语文成绩"这两个指标, 设置两个限制 条件 " > 80", 设置两个限制条件为 "且"的逻辑关系组合后, ***才形成 查询指令, 在数据库或数据源中进行查询筛选并展示。
因此, 在现有技术中, 用户无法通过输入自然语言语句来实现对数 据的查询和筛选。
有鉴于此, 本发明实施例提供了查询选取方法和查询选取***, 以 解决上述问题。
参见图 1 ,上述查询选取***至少可包括获取单元 1、预处理单元 2、 节点树构造单元 3、 翻译单元 4、 查询筛选单元 5和展示单元 6。
基于上述查询选取***, 参见图 2, 本发明实施例所提供的查询选 取方法至少包括如下步骤:
S1、 查询选取***(获取单元)获取用户输入的自然语言语句; 用户可以用手写、 按键或语音输入自然语言语句。 因此, 上述获取 单元具体可包括键盘、 麦克风(用于语音输入)、 手写笔和触摸屏 (手 写笔和触摸屏用于手写输入) 等。
52、 查询选取***(预处理单元)对用户输入的自然语言语句进行 预处理, 得到标准节点序列 (考虑到后续还将出现标准节点序列, 步骤 S2中得到的标准节点序列可称为第一标准节点序列)。
上述节点至少包括指标节点和条件节点, 而条件节点又可包括数字 节点、 日期节点和字符串节点中的至少一种。
53、 查询选取***(节点树构造单元)根据指标节点与其他节点之 间的关系, 构造节点树, 节点树用于表征指标条件组合;
54、 查询选取***(翻译单元)根据节点树生成数据查询指令;
55、 查询选取***(查询筛选单元)使用数据查询指令查询数据, 并对查询结果进行筛选, 得到筛选结果;
56、 查询选取***(展示单元)展示筛选结果。 具体的, 展示单元 可为显示屏。
经由上述的技术方案可知, 在本发明实施例中, 在用户输入自然语 言语句后, 由查询选取***自动对自然语言语句进行处理, 构成表征指 标条件组合的节点树, 并根据节点树生成数据查询指令, 在数据库中进 行查询筛选, 并展示给用户, 从而实现了用户通过输入自然语言语句来 对数据进行查询和筛选的目的。 并且, 在本发明实施例中, 用户只需要 输入自然语言语句, 而不再需要选择指标、 设置限制条件, 因此, 还简 化了用户操作, 节省了用户的操作时间。 下面将重点介绍步骤 S2 - S4的细节内容。
首先介绍步骤 S2。 在本发明其他实施例中, 参见图 3 , 上述步骤 S2 可具体包括:
S21、 将用户输入的自然语言语句进行分词处理, 得到多个词或词 组;
S22、 对每一个词或词组构造节点, 得到与用户输入的自然语言语 句相对应的原始节点序列;
原始节点序列中包括至少一个节点。
更具体的, 可通过配置词典对每个词或词组构造节点, 节点类型可 包括疑问词节点、 指标节点、 数字节点、 日期节点、 逻辑词节点、 字符 串节点等等, 最终得到与用户输入语句相对应的一个语义节点序列。
上述数字节点和字符串节点均可作为指标节点的限制条件值。 例 如, 在"三年级五班姓名李明的数学成绩"中, "李明 "是一字符串节点, 是"姓名"这一指标节点的限制条件值; 而在"数学成绩超 90分"中, "超 90分"这一数字节点是"数学成绩"这一指标节点的条件值。
在对数字节点和日期节点的配置中, 首先先确定某一词组是数字, 然后再确定这些数据是否是日期, 如果是, 将其构造成日期节点, 否则 将其构造成数字节点。
需要说明的, 一个特定的***(也即在特定应用场景下)可提供查 询选项 (也即查询指标)是固定的。 比如, 在学生成绩查询***中, 其 可提供的指标包括年级、 班级、 各科目 (数学、 语文、 地理、 历史、 生 物等) 等, 是固定的。 因此, 可利用指标关键词对分词得到的各词或词 组进行匹配, 从而确定出用户输入的语句中所包含的指标。
例如, 使用"科目"中数学、 语文、 地理、 历史、 生物等指标关键词, 对"三年级五班数学成绩超 90分, 以及语文成绩超过 80分的学生"这一 语句进行匹配, 可匹配出该语句包含 "数学"、 "语文 "两个指标。
同理, 逻辑词也是固定的, 可预先设置逻辑词字典, 该字典中包括 逻辑关键词 "并且"、 "和"、 "且"、 "同时"、 "与"、 "或"等, 使用逻辑关键 词对分词后的词或词组进行匹配, 可确定其是否是逻辑关系节点。
S23、 将原始节点序列转换为 (下述节点树构造单元可处理的)标 准节点序列;
由于用户在输入自然语言语句时, 带有很大的随意性, 因此其对应 的节点序列可能是非标准的。仍以上述提及的"三年级五班李明的数学成 绩"为例, 该句中只出现了"李明"这一词组, 但省略了"姓名", 这样, 其 对应的节点序列只有 "李明 "这一字符串节点, 而缺乏其相应的指标节点 - "姓名"。 因此, 需要对其补入指标节点(姓名), 将其转换成标准节点 序列 "三年级五班姓名李明的数学成绩"。
更具体的, 可根据配置规则将用户输入的自然语言语句对应的节点 序列转换为节点树构造单元可处理的标准节点序列:
首先通过检查关键词汇和匹配特殊句式特征判断原节点序列的句 式是否标准, 对检查到的非标准句式根据配置文件指定的转换规则转换 为标准句式对应的语义节点序列。 关键词汇可用正则表达式来表示。
举例来讲, 用户输入"连续 3天下雨", 可使用 "连续 *天"这一正则表 达式对其进行匹配和句式转换,将"连续 3天下雨 "转换成标准句式"今天 下雨, 并且昨天下雨, 并且前天下雨"。
同时, "下雨 "是条件节点中的字符串节点, 其与"天气状况"这一指 标相对应, 因此, 还需要将指标节点"天气状况"补入, 最终转换成的标 准节点序列为"今天天气状况下雨,并且昨天天气状况下雨,并且前天天 气状况下雨"。
需要说明的是, 如果用户以语音方式输入语句时, 上述步骤 S2还 包括对语音输入进行文字识别, 得到文字识别结果的步骤。 从而将语音 转化为文字。
在得出标准节点序列后, 接下来的步骤 S3是根据指标节点与其他 节点之间的关系, 构造节点树。
参见图 4, 步骤 S3可具体包括:
S31、 根据节点之间的位置关系, 确定指标条件组合;
举例来讲, "三年级五班数学成绩超 90 分, 以及语文成绩超过 80 分的学生"中, "数学成绩"为指标节点, "超 90分"为数字节点 (条件节 点), 并且, "数学成绩"与"超 90分"的位置关系是相邻, 因此, 可才艮据 二者的位置关系, 确定"超 90 分"是"数学成绩"这一指标节点的限制条 件, 也即"超 90分"是"数学成绩"这一指标节点的条件节点。
需要说明的是, "超 90分"并不是计算机可理解的准确数值范围。 因 此,需要解析"超 90分"这一数字节点,将其转化为 " > 90" 的数字节点。 而如果数字节点已经包含了准确数值范围,例如,用户输入了"三年级五 班数学成绩 > 90"的语句, 则不需要对数字节点进行解析。
更具体的, 在解析时, 可将"超"、 "大于"、 "高于 "转化为" >", 将"小 于"、 "少于"、 "低于 "转化为" <", 将"不大于"、 "小于等于"、 "不超过"、 "不高于"转化为"《", 将"不小于"、 "小于等于"、 "不少于"、 "不低于" 转化为"》 "。
同理, 日期节点如果未包含计算机可理解的准确日期范围, 则需要 对日期节点进行解析转换。反之, 则不需要解析日期节点。例如, "今年" 并不是计算机可理解的准确日期范围, 如果今年为 2013 年, 需要将其 转化为日期节点" 2013"。 相应的, 逻辑词节点也需要进行转换, 例如, 将逻辑词节点 "并且"、 "和"、 "且"、 "同时"、 "与"等, 转换为 "and"或" 将逻辑词节点"或"、 "或者 "转换为" or"。 以此类推, 可最终得到指标条件组合。
S32、 根据指标条件组合构造节点树。
"2013年三年级五班数学成绩超 90分, 以及语文成绩超过 80分的 学生"对应的节点树可参见图 5。
此外,需要说明的是,节点树中的每一指标节点对应一个条件节点。 以"连续 3年同比增长率超过 50%的股票为例", 其实际是三个指标条件 的组合:
( 1 ) , 最近一年(假设是 2013年) 的同比增长率 >50%;
( 2 ) , 前推一年 ( 2012年) 同比增长率 >50%;
( 3 ) , 前推两年 ( 2011年) 的同比增长率 >50%。
因此, 参见图 6, "连续 3年同比增长率超过 50%的股票为例"所对 应的节点树中包括三个"同比增长率"指标节点, 每一指标节点对应一个 条件节点。
相应的, 上述步骤 S4可具体包括: 确定节点树中各指标节点对应的数据源;
根据数据源的格式要求, 将相应指标节点及条件节点翻译成符合数 据源格式要求的查询指令。
这是因为, 不同指标所对应的数据可能存储于不同的数据源或数据 库中, 而每个数据源所支持的查询指令格式可能也是不一样的, 因此, 需要针对不同数据源翻译出不同格式的查询指令。
尽管指令格式可能不一致, 但各个数据源本身都支持按指标条件查 询, 利用这一特点, 本发明实施例对于每一数据源都针对其特有的查询 指令格式配置了按指标条件查询的指令翻译程序, 并且, 在本发明实施 例中, 对用户输入的语句语义的理解, 与最终数据的获取是分离的。
相应的, 上述步骤 S5中"对查询结果进行筛选 "可包括: 根据节点树中各指标节点间的关系, 对查询成果进行合并操作和 / 或过滤操作。 具体的, 在获取到查询结果后, 按照指标间的逻辑组合关系进行合 并和过滤, 保留同时符合所有指标条件组合的查询结果。 现举一过滤的例子, 以图 6节点树为例, 前已述及, "连续 3年同比 增长率超过 50%的股票为例"所对应的节点树中包括三个"同比增长率" 指标节点, 每一指标节点对应一个条件节点。 根据查询指令得到的查询结果有三类: 第一种, 最近一年(假设是 2013年) 同比增长率 >50%的股票; 第二种, 2012年同比增长率 >50%的股票; 第三种, 2011年同比增长率 >50%的股票。 根据图 6的节点树, 三个指标节点之间为 "且"的逻辑关系, 根据该 逻辑关系, 对上述三种查询结果进行合并和过滤, 得到同时满足 2013 年同比增长率 >50%、 2012 年同比增长率 >50%和 2011 年同比增长 率>50%的股票。 另外, 需要说明的是, 仍以"连续 3年同比增长率超过 50%的股票" 为例, 其所对应的节点树中包括三个"同比增长率"指标节点, 在生成查 询指令时, 可分别根据三个指标节点生成三个查询指令, 在得到查询结 果后, 再对查询结果进行过滤。 也可以生成一个查询指令, 查询同时满 足三个指标条件值的数据, 此时, 就不再需要对查询结果进行过滤了。 至于合并, 主要是针对不同指标对应不同数据源的情况, 在从多个 数据源获得查询结果后, 可对这些查询结果进行合并。 在本发明其他实施例中, 参见图 7, 在步骤 S6后, 还可包括如下步 骤:
S7、 查询选取***展示指标条件组合。 考虑到用户出于种种原因会更改指标, 在本发明其他实施例中, 上 述方法还可包括如下步骤:
查询选取***获取用户输入的条件更改指令。 在获取条件更改指令后, ***将进行条件更改, 并重新生成数据查 询指令。 相应的, 上述查询选取***可包括指令更改单元, 用于获取用户输 入的条件更改指令进行条件更改, 并重新生成数据查询指令。 条件更改又可具体包括条件追加、 条件修改和条件删除。 针对条件追加, 用户可采用类似于现有技术中的方式, 选择需要追 加的指标, 并配置指标对应的限制条件。 用户也可追加自然语言条件。 可设置一个按键或图标, 用户点击, 则指令更改单元被触发。 更具体的, 参见图 8, 如果用户选择了自然语言条件这个方式, 则 需要(步骤 S10 )获取用户输入追加的自然语言语句 (类似于步骤 S1 ), (步骤 S11 ) 并对追加的自然语言语句进行预处理得到第二标准节点序 列 (类似于步骤 S2 ), (步骤 S12 )再将第二标准节点序列和原来的第一 标准节点序列合并, 形成新第一标准节点序列后, 经过步骤 S3 重新生 成查询指令进入步骤 S4重新查询和筛选。
而如果用户只是想修改某些指标对应的条件, 或者想删除某些条件 或指标, 则 (步骤 S13 ) 直接修改或删除第一标准节点序列中的相应节 点, 进入步骤 S3。
在具体实施时, 在执行步骤 S7后, 查询选取***可同时提供 "条 件追加"、 "条件修改"、 "条件删除"按钮, 以方便用户操作。
此外, 需要说明的是, 请参见图 9, 上述步骤 S7 , 也可发生在步骤 S3之前, 而用户更改条件的时机, 也可选择在执行步骤 S3之前。
或者, 请参见图 10, 在步骤 S2后, 还可包括如下步骤:
514、展示第一标准节点序列。 以便用户得知***所 "理解 "的指标条 件组合。
例如, 用户输入"三年级五班李明的数学成绩", 将其转换成第一标 准节点序列为 "年级三年级班级五班姓名李明的科目数学成绩"并展示。
515、 判断用户是否确认指标条件正确。
可提供确认按钮, 以供用户进行确认。 如果用户确认正确, 则执行 步骤 S3。
如果用户认为指标条件不正确, 则输入条件更改指令, 进行条件追 加、 条件修改或条件删除, 在此不作赘述。 在具体实施时, 在执行步骤 S14后, 查询选取***可同时提供"确 认"、 "条件追加"、 "条件修改"、 "条件删除"按钮, 以方便用户操作。
下面将以 "连续 3年净利润增长超过 50%的股票 "为例,对本发明的 实施过程进行描述。
步骤( 1 )用户输入自然语言语句"连续 3年净利润增长超过 50%的 股票"。
步骤( 2 )得到"连续 3年 I净利润 I增长 I超过 50%|的股票 "的原始节点 序列, 其中用 T区分节点。
在该步骤, 可明确查询的是股票。 并根据配置文件中提供的"净利 润""增长"特征将非标准句式转换为标准句式"连续 3 年 I净利润 (同比增 长率) I超过 50%|的股票"。
步骤( 3 ) , 对数字节点和时间节点进行解析。
在本实施例中, 可将"超过 50%"转化为" >50%", 将"连续 3年"转化 为最近一年开始前推两年的具体时间范围。
步骤(4 ), 构造节点树。
首先, 将" >50%"的数字节点, 表示绑定为"净利润(同比增长率)"这 一指标的值过滤条件, 将"连续 3年"的时间节点绑定为"净利润(同比增 长率)"的时间参数;
再根据 "净利润(同比增长率) "这一指标绑定的时间参数为年度的特 点, 将"连续 3年"拆分为"最近一年"、 "前推一年"、 "前推两年" 3个年度 时间节点, 并对其它节点进行复制, 最后得到表征 3个指标条件组合的 节点树(请参见图 6 )。
需要指出的是, 传统的选股工具在处理这种选股需求时, 通常要求 用户分 3 次选择"净利润(同比增长率)"这一指标, 每次需要用户为指标 选定是哪一年, 同时每次需设置指标值大于 50%的限制条件, 因此操作 繁瑣, 而本发明实施例只要求用户输入一句自然语言语句, 因此, 极大 得简化了用户操作。 步骤(5 ), 将以上指标条件组合翻译数据查询指令。
首先, 确定"净利润(同比增长率)"这一指标对应的数据源, 然后根 据数据源要求的查询指令格式将以上 3个指令条件组合翻译为数据源支 持的查询指令。
步骤(6 ), 执行查询指令, 按净利润(同比增长率) >50%的条件过滤 掉所有不符合条件的股票。
步骤(7 ), 将查询出的股票及相关的净利润(同比增长率)数据展示 在界面上, 同时也将得到的指标条件组合显示给用户, 方便用户检查验 证。
步骤( 8 ),用户可以选择更改条件 (也即前述的输入条件更改指令), 如追加一个条件"浙江省",这样可以选出 "浙江省"的"连续 3年净利润增 长超过 50%的股票"。 或者, 用户将最近一年的净利润(同比增长率)大于 50%修改为小于 30%等等, 然后重新进行选股。
如果用户不再更改条件, 则一次正常流程结束。
需要说明的是, 本发明实施例所提供的技术方案, 其可用于搜索领 域、 通信领域、 工业领域等。 现简单各举一例说明。 在搜索领域方面,用户在网页中输入自然语言语句,网页服务器(也 即查询选取***)可执行步骤 S1 - S4,将用户输入的自然语言语句转化 为数据查询指令, 然后, 网页服务器在使用数据查询指令进行查询得到 查询结果, 并进行筛选(步骤 S5 ) ,并将筛选结果返回至客户端显示, 则完成了一次搜索。 在通信领域应用方面, 例如, 用户输入"打电话给李明", 手机(也 即查询选取***)执行步骤 S1 - S2后, 将用户输入的自然语句转化为 标准节点序列 "打电话给联系人李明",其中"联系人"为指标节点, "李明" 为字符串节点。 在步骤 S3 - S5 中, 生成数据指令, 查询手机的联系人 列表, 找到"李明"的电话号码并展示。 此后, 上述方法还可进一步包括 根据筛选结果—— "李明 "的电话号码, 发起通信呼叫。
在工业控制应用(例如炼钢领域)方面, 如用户输入"将温度保持在
50度", 则 PLC (也即查询选取***)进行步骤 S1 - S2步骤后, 获知"温 度"为指标节点, "50度"为数字节点。 则在步骤 S3 - S6中, PLC将生成 数据指令, 查询炼钢生产线当前的温度值并显示 (炼钢生产线会定时将 当前的温度值上传至某一数据库)。 此后, 上述方法还可进一步包括, 将炼钢生产线当前的温度值与" 50度"相比较, 如果前者低于后者, 则进 行加温, 如果前者高于后者, 则进行降温。
与之相对应, 本发明实施例还要求保护查询选取***, 仍请参见图 1 , 该***至少可包括:
获取单元 1 , 用于获取用户输入的自然语言;
预处理单元 2, 用于对用户输入的自然语言进行预处理, 得到第一 标准节点序列, 节点至少包括指标节点和条件节点, 条件节点包括数字 节点、 日期节点和字符串节点中的至少一种;
节点树构造单元 3 , 用于根据指标节点与其他节点之间的关系, 构 造节点树, 节点树用于表征指标条件组合;
翻译单元 4, 用于将节点树翻译成数据查询指令;
查询筛选单元 5, 用于使用数据查询指令查询数据, 并对查询结果 进行歸选, 得到歸选结果;
展示单元 6, 用于展示筛选结果。
展示单元 6还可以用于展示指标条件组合。
具体细节请参见本文前述方法部分的介绍, 在此不作赘述。 在本发明其他实施例中, 上述查询选取***还可包括更改单元, 用 于获取用户输入的条件更改指令进行条件更改。
更具体的, 更改单元可包括条件追加单元、 条件修改 /删除单元。 条件追加单元在用户输入追加的自然语言语句时, 获取用户输入追 加的自然语言语句, 并对追加的自然语言语句进行预处理得到第二标准 节点序列, 再和原有的第一标准节点序列合并后, 指示节点树构造单元
3重新生成数据查询指令。
而条件修改 /删除单元, 可根据用户的修改或删除操作, 修改或删除 原有第一标准节点序列中的相应节点, 指示节点树构造单元 3重新生成 数据查询指令。
具体细节请参见本文前述方法部分的介绍, 在此不作赘述。
最后需要说明的是, 查询选取***中的预处理单元、 节点树构造单 元、 翻译单元、 查询筛选单元、 指令更改单元既可为硬件单元、 电路, 也可为逻辑单元, 在为逻辑单元时, 具体由处理器完成各单元的功能。
本说明书中各个实施例采用递进的方式描述, 每个实施例重点说明 的都是与其他实施例的不同之处, 各个实施例之间相同相似部分互相参 见即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用 硬件、 处理器执行的软件模块, 或者二者的结合来实施。 软件模块可以 置于随机存储器(RAM )、 内存、 只读存储器(ROM )、 电可编程 ROM、 电可擦除可编程 ROM、 寄存器、 硬盘、 可移动磁盘、 CD-ROM、 或技 术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明, 使本领域专业技术人员能够实现或 使用本发明。 对这些实施例的多种修改对本领域的专业技术人员来说将 是显而易见的, 本文中所定义的一般原理可以在不脱离本发明的精神或 范围的情况下, 在其它实施例中实现。 因此, 本发明将不会被限制于本 文所示的这些实施例, 而是要符合与本文所公开的原理和新颖特点相一 致的最宽的范围。

Claims

权 利 要 求 书
1、 一种查询选取方法, 其特征在于, 至少基于查询选取***, 包 括:
查询选取***获取用户输入的自然语言语句;
查询选取***对所述用户输入的自然语言语句进行预处理, 得到标 准节点序列, 所述节点至少包括指标节点和条件节点, 所述条件节点包 括数字节点、 日期节点、 字符串节点中的至少一种;
查询选取***根据指标节点与其他节点之间的关系, 构造节点树, 所述节点树用于表征指标条件组合;
查询选取***根据所述节点树生成数据查询指令;
查询选取***使用所述数据查询指令查询数据, 并对查询结果进行 筛选, 得到筛选结果;
查询选取***展示所述筛选结果。
2、 如权利要求 1所述的方法, 其特征在于, 还包括:
查询选取***展示指标条件组合。
3、 如权利要求 2所述的方法, 其特征在于: 还包括:
查询选取***获取用户输入的条件更改指令, 并根据所述条件更改 指令重新生成数据查询指令。
4、 如权利要求 3所述的方法, 其特征在于, 所述条件更改包括条 件追加、 条件修改和条件删除。
5、 如权利要求 1所述的方法, 其特征在于, 所述对查询结果进行 筛选包括: 根据节点树中各指标节点间的关系, 对所述查询成果进行合 并操作和 /或过滤操作。
6、 如权利要求 5所述的方法, 其特征在于, 所述预处理包括: 将所述用户输入的自然语言语句进行分词处理, 得到多个词或词 组;
对每一个词或词组构造节点, 得到原始节点序列;
将原始节点序列转换为标准节点序列。
7、 如权利要求 6所述的方法, 其特征在于, 所述根据指标节点与 其他节点之间的关系, 构造节点树包括:
至少根据节点之间的位置关系, 确定指标条件组合;
根据所述指标条件组合构造节点树。
8、 如权利要求 1所述的方法, 其特征在于, 所述根据所述节点树 生成数据查询指令包括:
确定所述节点树中各指标节点对应的数据源;
根据数据源的格式要求, 将相应指标节点及条件节点翻译成符合数 据源格式要求的查询指令。
9、 一种查询选取***, 其特征在于, 包括:
获取单元, 用于获取用户输入的自然语言;
预处理单元, 用于对所述用户输入的自然语言进行预处理, 得到标 准节点序列, 所述节点至少包括指标节点和条件节点, 所述条件节点包 括数字节点、 日期节点和字符串节点中的至少一种;
节点树构造单元, 用于根据指标节点与其他节点之间的关系, 构造 节点树, 所述节点树用于表征指标条件组合;
翻译单元, 用于将所述节点树翻译成数据查询指令;
查询筛选单元, 用于使用所述数据查询指令查询数据, 并对查询结 果进行筛选, 得到筛选结果;
展示单元, 用于展示所述筛选结果。
PCT/CN2014/080619 2013-04-28 2014-06-24 查询选取方法及*** WO2014177118A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US14/787,472 US10185772B2 (en) 2013-04-28 2014-06-24 Query selection method and system
US16/252,819 US10922371B2 (en) 2013-04-28 2019-01-21 Query selection method and system
US17/134,566 US11714861B2 (en) 2013-04-28 2020-12-28 Query selection method and system
US18/335,097 US20230325447A1 (en) 2013-04-28 2023-06-14 Query selection method and system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310155688.6A CN103226606B (zh) 2013-04-28 2013-04-28 查询选取方法及***
CN201310155688.6 2013-04-28

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US14/787,472 A-371-Of-International US10185772B2 (en) 2013-04-28 2014-06-24 Query selection method and system
US16/252,819 Continuation US10922371B2 (en) 2013-04-28 2019-01-21 Query selection method and system
US16/252,819 Continuation-In-Part US10922371B2 (en) 2013-04-28 2019-01-21 Query selection method and system

Publications (1)

Publication Number Publication Date
WO2014177118A1 true WO2014177118A1 (zh) 2014-11-06

Family

ID=48837051

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/080619 WO2014177118A1 (zh) 2013-04-28 2014-06-24 查询选取方法及***

Country Status (3)

Country Link
US (4) US10185772B2 (zh)
CN (1) CN103226606B (zh)
WO (1) WO2014177118A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125159A (zh) * 2019-12-24 2020-05-08 亚信科技(中国)有限公司 一种数据统计的方法及装置
CN116561132A (zh) * 2023-07-06 2023-08-08 深圳市明源云科技有限公司 业务数据查询方法、电子设备及可读存储介质

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226606B (zh) 2013-04-28 2016-08-10 浙江核新同花顺网络信息股份有限公司 查询选取方法及***
CN104462150A (zh) * 2013-09-25 2015-03-25 中兴通讯股份有限公司 一种网元管理***中告警过滤方法及装置
US9798801B2 (en) 2014-07-16 2017-10-24 Microsoft Technology Licensing, Llc Observation-based query interpretation model modification
CN105975598A (zh) * 2016-05-10 2016-09-28 国网浙江省电力公司丽水供电公司 基于条件检索的模拟操作方式获取数据的事件预警方法
CN106020797A (zh) * 2016-05-10 2016-10-12 国网浙江省电力公司丽水供电公司 针对html应用的免接口跨***数据查询及预警方法
US10585903B2 (en) * 2016-12-05 2020-03-10 Dropbox, Inc. Identifying relevant information within a document hosting system
CN109829098A (zh) * 2017-08-28 2019-05-31 广东神马搜索科技有限公司 搜索结果优化方法、装置及服务器
CN109491658A (zh) * 2017-09-11 2019-03-19 高德信息技术有限公司 计算机可执行代码数据的生成方法及装置
CN107832310A (zh) * 2017-11-27 2018-03-23 首都师范大学 基于seq2seq模型的结构化论点生成方法及***
CN108108426B (zh) * 2017-12-15 2021-05-07 杭州汇数智通科技有限公司 自然语言提问的理解方法、装置及电子设备
US20190385711A1 (en) 2018-06-19 2019-12-19 Ellipsis Health, Inc. Systems and methods for mental health assessment
EP3811245A4 (en) 2018-06-19 2022-03-09 Ellipsis Health, Inc. MENTAL HEALTH ASSESSMENT SYSTEMS AND METHODS
CN110728113A (zh) * 2018-06-28 2020-01-24 北京金山办公软件股份有限公司 一种电子表格的信息筛选方法、装置及终端设备
CN109189901B (zh) * 2018-08-09 2021-05-18 北京中关村科金技术有限公司 一种智能客服***中自动发现新分类以及对应语料的方法
CN109408573A (zh) * 2018-10-11 2019-03-01 上海瀚银信息技术有限公司 一种数据库的数据采集***及数据采集方法
CN109766355A (zh) * 2018-12-28 2019-05-17 上海汇付数据服务有限公司 一种支持自然语言的数据查询方法和***
CN110008239A (zh) * 2019-03-22 2019-07-12 跬云(上海)信息科技有限公司 基于预计算优化的逻辑执行优化方法及***
US11645628B2 (en) * 2019-05-16 2023-05-09 Microsoft Technology Licensing, Llc Translation of time between calendar systems
CN112346923B (zh) * 2019-08-08 2022-12-13 中移(苏州)软件技术有限公司 云平台的指标数据采集方法、装置和存储介质
US11615240B2 (en) * 2019-08-15 2023-03-28 Salesforce.Com, Inc Systems and methods for a transformer network with tree-based attention for natural language processing
CN110750192A (zh) * 2019-09-23 2020-02-04 紫光云(南京)数字技术有限公司 基于可视化编辑***的过滤模型方法
CN112328837A (zh) * 2020-10-28 2021-02-05 北京鸿腾智能科技有限公司 数据展示方法、装置、设备及存储介质
CN112270189B (zh) * 2020-11-12 2023-07-18 佰聆数据股份有限公司 一种提问式的分析节点生成方法、***及存储介质
CN112069305B (zh) * 2020-11-13 2021-03-30 北京智慧星光信息技术有限公司 数据筛选方法、装置及电子设备
US11514405B1 (en) 2021-05-14 2022-11-29 Microsoft Technology Licensing, Llc Map calendar graphical user interface with dynamic time mold functionality
US11681424B2 (en) 2021-05-14 2023-06-20 Microsoft Technology Licensing, Llc Map calendar graphical user interface with content-variable view levels
CN113517047A (zh) * 2021-06-08 2021-10-19 联仁健康医疗大数据科技股份有限公司 医学数据的获取方法、装置、电子设备及存储介质
US11593367B1 (en) 2021-09-29 2023-02-28 Amazon Technologies, Inc. Selecting between hydration-based scanning and stateless scale-out scanning to improve query performance
CN114090577A (zh) * 2021-11-04 2022-02-25 支付宝(杭州)信息技术有限公司 时序数据的存储、读取方法及装置
US11727003B2 (en) 2021-11-26 2023-08-15 Amazon Technologies, Inc. Scaling query processing resources for efficient utilization and performance
CN114185929B (zh) * 2022-02-15 2022-11-22 支付宝(杭州)信息技术有限公司 一种获取用于数据查询的可视化配置的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079051A (zh) * 2007-06-11 2007-11-28 周广宇 在网络环境下进行结构化信息发布与搜索的方法
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与***
CN102779163A (zh) * 2012-06-18 2012-11-14 青岛禧泰房产数据技术有限公司 量化检索方法及量化检索***
CN103226606A (zh) * 2013-04-28 2013-07-31 浙江核新同花顺网络信息股份有限公司 查询选取方法及***

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594783B1 (en) * 1999-08-27 2003-07-15 Hewlett-Packard Development Company, L.P. Code verification by tree reconstruction
TW432298B (en) * 1999-09-20 2001-05-01 Inst Information Industry Natural language indexing system and method for relational database
US7403938B2 (en) 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
CN1521661A (zh) 2003-01-29 2004-08-18 黄致辉 一种利用自然语言处理功能进行信息检索的方法
CN100485666C (zh) * 2004-04-29 2009-05-06 Nec软件有限公司 结构化自然语言查询和知识***
US20060224566A1 (en) 2005-03-31 2006-10-05 Flowers John S Natural language based search engine and methods of use therefor
US7761843B2 (en) * 2005-07-01 2010-07-20 Ronald Ortscheid Computer source code generator
US20090112835A1 (en) * 2007-10-24 2009-04-30 Marvin Elder Natural language database querying
CN101872349B (zh) 2009-04-23 2013-06-19 国际商业机器公司 处理自然语言问题的方法和装置
CN101930428A (zh) * 2009-06-18 2010-12-29 万继华 计算机理解自然语言的***及方法
US9092424B2 (en) * 2009-09-30 2015-07-28 Microsoft Technology Licensing, Llc Webpage entity extraction through joint understanding of page structures and sentences
CN102262634B (zh) * 2010-05-24 2013-05-29 北京大学深圳研究生院 一种自动问答方法及***
US8862458B2 (en) * 2010-11-30 2014-10-14 Sap Ag Natural language interface
US20130080472A1 (en) * 2011-09-28 2013-03-28 Ira Cohen Translating natural language queries
CN103092979B (zh) 2013-01-31 2016-01-27 中国科学院对地观测与数字地球科学中心 遥感数据检索自然语言的处理方法
CN103530415A (zh) 2013-10-29 2014-01-22 谭永 一种兼容关键词搜索的自然语言搜索方法及***
KR20180001889A (ko) * 2016-06-28 2018-01-05 삼성전자주식회사 언어 처리 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079051A (zh) * 2007-06-11 2007-11-28 周广宇 在网络环境下进行结构化信息发布与搜索的方法
CN101510221A (zh) * 2009-02-17 2009-08-19 北京大学 一种用于信息检索的查询语句分析方法与***
CN102779163A (zh) * 2012-06-18 2012-11-14 青岛禧泰房产数据技术有限公司 量化检索方法及量化检索***
CN103226606A (zh) * 2013-04-28 2013-07-31 浙江核新同花顺网络信息股份有限公司 查询选取方法及***

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125159A (zh) * 2019-12-24 2020-05-08 亚信科技(中国)有限公司 一种数据统计的方法及装置
CN116561132A (zh) * 2023-07-06 2023-08-08 深圳市明源云科技有限公司 业务数据查询方法、电子设备及可读存储介质
CN116561132B (zh) * 2023-07-06 2023-12-22 深圳市明源云科技有限公司 业务数据查询方法、电子设备及可读存储介质

Also Published As

Publication number Publication date
US20190155862A1 (en) 2019-05-23
US20160078135A1 (en) 2016-03-17
CN103226606B (zh) 2016-08-10
US11714861B2 (en) 2023-08-01
CN103226606A (zh) 2013-07-31
US20230325447A1 (en) 2023-10-12
US20210117493A1 (en) 2021-04-22
US10185772B2 (en) 2019-01-22
US10922371B2 (en) 2021-02-16
US20200226190A9 (en) 2020-07-16

Similar Documents

Publication Publication Date Title
WO2014177118A1 (zh) 查询选取方法及***
US11782981B2 (en) Method, apparatus, server, and storage medium for incorporating structured entity
US10678783B2 (en) Interactive user interface for dynamic data analysis exploration and query processing
CN108829858B (zh) 数据查询方法、装置及计算机可读存储介质
US20180039399A1 (en) Interactive user interface for dynamically updating data and data analysis and query processing
US9652451B2 (en) Natural language query
US10860632B2 (en) Information query method and device
US11080295B2 (en) Collecting, organizing, and searching knowledge about a dataset
US9164962B2 (en) Document assembly systems and methods
US20090287680A1 (en) Multi-modal query refinement
WO2021135439A1 (zh) 基于语音语义的信息检索方法、及其相关设备
EP3340078B1 (en) Interactive user interface for dynamically updating data and data analysis and query processing
US20220067105A1 (en) Search engine for concatenating and searching combinations of data files
CN111190920B (zh) 一种基于自然语言的数据交互查询方法及其***
WO2017025055A1 (zh) 命令行界面显示方法及装置
US20180067986A1 (en) Database model with improved storage and search string generation techniques
WO2023160137A1 (zh) 图数据存储方法、***及计算机设备
US10289740B2 (en) Computer systems to outline search content and related methods therefor
US11507593B2 (en) System and method for generating queryeable structured document from an unstructured document using machine learning
JP7096289B2 (ja) 構造化クエリステートメントを出力する方法および装置
US20210117920A1 (en) Patent preparation system
CN113420219A (zh) 用于查询信息纠错的方法、装置、电子设备及可读存储介质
JP5544003B2 (ja) 情報検索装置、情報検索システム、及び情報検索方法
WO2015109835A1 (zh) 一种搜索方法及终端设备
US20240104297A1 (en) Analysis of spreadsheet table in response to user input

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14791269

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14787472

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 14791269

Country of ref document: EP

Kind code of ref document: A1