CN104252488A - 处理数据的方法和服务器 - Google Patents
处理数据的方法和服务器 Download PDFInfo
- Publication number
- CN104252488A CN104252488A CN201310268687.2A CN201310268687A CN104252488A CN 104252488 A CN104252488 A CN 104252488A CN 201310268687 A CN201310268687 A CN 201310268687A CN 104252488 A CN104252488 A CN 104252488A
- Authority
- CN
- China
- Prior art keywords
- event
- information
- keyword
- meaning
- key content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了处理数据的方法和服务器。该方法包括:获取第一事件的记录信息,第一事件的记录信息用于描述第一事件;根据第一事件的记录信息,确定第一事件的特征信息,第一事件的特征信息属于结构化数据,第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息;在事件数据库中对第一事件的特征信息进行匹配,以确定在事件数据库中是否存在与第一事件相匹配的第二事件,事件数据库用于存储至少一项事件的特征信息。本发明实施例中,通过根据包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息的第一事件的特征信息来确定是否存在与第一事件相匹配的第二事件,从而能够提升对重复事件检索的准确性。
Description
技术领域
本发明涉及信息技术领域,并且具体地,涉及处理数据的方法和服务器。
背景技术
随着信息化技术的发展,政府或企业面向公众提供投诉、报警等服务的渠道日渐丰富。人们可以通过到访、电话、网站或电子邮件等多种渠道,向政府或企业反映问题。
政府或企业的业务受理部门可以将公众反映的问题记录在***中,然后根据问题的性质派发给相应的业务办理部门进行处理。由于同一个问题可能被多次反映,因此业务受理部门需要依据***的检索结果来确认反映的问题是否重复,从而避免同一问题重复受理。在现有技术中,***是通过对简单的结构化数据进行检索,例如问题的反映时间或反映人电话等结构化数据,来判断当前的问题是否已被记录过,从而得到最终的检索结果。但是,由于所反映的问题的结构化数据有限,因此导致检索结果准确性差。
发明内容
本发明实施例提供处理数据的方法和服务器,能够提升对重复事件检索的准确性。
第一方面,提供了一种处理数据的方法,包括:获取第一事件的记录信息,所述第一事件的记录信息用于描述所述第一事件;根据所述第一事件的记录信息,确定第一事件的特征信息,所述第一事件的特征信息属于结构化数据,所述第一事件的特征信息包括所述第一事件的记录时间、所述第一事件的属性和所述第一事件的关键内容信息;在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,所述事件数据库用于存储至少一项事件的特征信息。
结合第一方面,在第一种可能的实现方式中,所述第一事件的关键内容信息包括所述第一事件的关键词所对应的词义;
所述根据所述第一事件的记录信息,确定第一事件的特征信息,包括:根据关键词数据库,在所述第一事件的记录信息中提取所述第一事件的关键词,所述关键词数据库用于存储至少一个关键词;根据词义数据库以及所述第一事件的关键词,确定所述第一事件的关键词所对应的词义,所述词义数据库用于存储所述至少一个关键词分别对应的词义。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,包括:确定所述第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定所述第一事件的属性是否与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值;在确定所述第一事件的记录时间和第三事件的记录事件在所述时间区间内,确定所述第一事件的属性与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率大于所述阈值的情况下,确定所述第三事件为所述第二事件。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述第三事件的关键内容信息包括所述第三事件的关键词所对应的词义;
确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值,包括:确定所述第一事件的关键词所对应的词义与所述第三事件的关键词所对应的词义之间的匹配率是否大于所述阈值。
结合第一方面或第一方面的第一种可能的实现方式至第三种可能的实现方式中任一方式,在第四种可能的实现方式中,还包括:在确定存在所述第二事件的情况下,呈现所述第二事件的特征信息。
结合第一方面或第一方面的第一种可能的实现方式至第四种可能的实现方式中任一方式,在第五种可能的实现方式中,还包括:在确定存在所述第二事件的情况下,确定所述第一事件的反映人信息和所述第二事件的反映人信息;在确定所述第一事件的反映人信息与所述第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现所述第一提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人相同;在确定所述第一事件的反映人信息与所述第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现所述第二提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人不相同。
第二方面,提供了一种服务器,包括:获取单元,用于获取第一事件的记录信息,所述第一事件的记录信息用于描述所述第一事件;确定单元,用于根据所述第一事件的记录信息,确定第一事件的特征信息,所述第一事件的特征信息属于结构化数据,所述第一事件的特征信息包括所述第一事件的记录时间、所述第一事件的属性和所述第一事件的关键内容信息;匹配单元,用于在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,所述事件数据库用于存储至少一项事件的特征信息。
结合第二方面,在第一种可能的实现方式,所述第一事件的关键内容信息包括所述第一事件的关键词所对应的词义;
所述确定单元,具体用于:根据关键词数据库,在所述第一事件的记录信息中提取所述第一事件的关键词,所述关键词数据库用于存储至少一个关键词;根据词义数据库以及所述第一事件的关键词,确定所述第一事件的关键词所对应的词义,所述词义数据库用于存储所述至少一个关键词分别对应的词义。
结合第二方面的第一种可能的实现方式中,在第二种可能的实现方式中,所述匹配单元,具体用于:确定所述第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定所述第一事件的属性是否与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值;在确定所述第一事件的记录时间和第三事件的记录事件在所述时间区间内,确定所述第一事件的属性与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率大于所述阈值的情况下,确定所述第三事件为所述第二事件。
结合第二方面的第二种可能的实现方式中,在第三种可能的实现方式中,所述第三事件的关键内容信息包括所述第三事件的关键词所对应的词义;
所述匹配单元,具体用于:确定所述第一事件的关键词所对应的词义与所述第三事件的关键词所对应的词义之间的匹配率是否大于所述阈值。
结合第二方面或第二方面的第一种可能的实现方式至第三种可能的实现方式中任一实现方式,在第四种可能的实现方式中,还包括:第一呈现单元,用于在确定存在所述第二事件的情况下,呈现所述第二事件的特征信息。
结合第二方面或第二方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,还包括第二呈现单元;
所述确定单元,还用于在确定存在所述第二事件的情况下,确定所述第一事件的反映人信息和所述第二事件的反映人信息;所述第二呈现单元,用于在确定所述第一事件的反映人信息与所述第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现所述第一提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人相同;所述第二呈现单元,还用于在确定所述第一事件的反映人信息与所述第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现所述第二提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人不相同。
本发明实施例中,通过根据第一事件的记录信息确定属于结构化数据的第一事件的特征信息,并对第一事件的特征信息进行匹配来确定在事件数据库中是否存在与第一事件相匹配的第二事件,其中第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息,从而能够提升第二事件与第一事件的匹配准确性,从而能够提升对重复事件检索的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的处理数据的方法的示意性流程图。
图2是根据本发明实施例的服务器的示意框图。
图3是根据本发明另一实施例的服务器的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
图1是根据本发明实施例的处理数据的方法的示意性流程图。图1的方法由服务器执行。
110,获取第一事件的记录信息,第一事件的记录信息用于描述第一事件。
例如,服务器可以从用于存储各项事件的记录信息的数据库中获取第一事件的记录信息。
可以通过多种方式采集记录信息,例如,可以业务受理部门通过接访或电话等方式将记录信息记录在服务器中,或者可以是由事件反映人通过网站或电子邮件等方式记录在服务器中。
第一事件的记录信息可以是第一事件的描述信息。例如,第一事件的记录信息可以包括第一事件的记录时间、第一事件的属性以及第一事件的内容说明等。其中,第一事件的属性可以表示第一事件的性质,例如可以包括事件发生地或事件的分类等,比如事件发生地可以是某区或某街道,事件的分类可以是咨询类、投诉类或求助类等。
从上述可知,记录信息可以是反映人对第一事件的描述,因此,记录信息可以包括结构化数据和非结构化数据。例如,记录时间和属性可以是结构化数据,第一事件的内容说明可以是非结构化数据。结构化数据可以是指能够利用统一的结构表示的数据,例如数字或符号等。非结构化数据可以是指无法用统一的结构表示的数据,例如文本等。例如,对于记录时间,可以统一使用xx年xx月xx日的结构或者xx-xx-xx的结构表示。对于事件发生地,可以统一使用xx区xx街道的结构表示。而对于内容说明,由于同一事件可以有多种表述方式,是无法使用统一的结构来表示的。
120,根据第一事件的记录信息,确定第一事件的特征信息,第一事件的特征信息属于结构化数据,第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息。
为了在下述步骤130中能够对第一事件的特征信息进行匹配,服务器可以根据第一事件的记录信息确定属于结构化数据的特征信息。第一事件的关键内容信息可以用于描述第一事件的主要含义,例如,假设在第一事件的记录信息中第一事件的内容说明为施工噪声过大,那么第一事件的关键内容信息可以包括“施工、噪声”。
130,在事件数据库中对第一事件的特征信息进行匹配,以确定在事件数据库中是否存在与第一事件相匹配的第二事件,事件数据库用于存储至少一项事件的特征信息。
事件数据库可以存储之前所反映的各项事件的特征信息。类似于第一事件的特征信息,历史事件的特征信息也可以包括事件的记录事件、事件的属性以及事件的关键内容信息。
服务器在事件数据库中对第一事件的特征信息进行匹配,从而确定是否存在与第一事件相匹配的第二事件。本发明实施例中,第一事件与第二事件相匹配也就是指第一事件与第二事件为相同的事件。
本发明实施例中,通过根据第一事件的记录信息确定属于结构化数据的第一事件的特征信息,并对第一事件的特征信息进行匹配来确定在事件数据库中是否存在与第一事件相匹配的第二事件,其中第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息,从而能够提升第二事件与第一事件的匹配准确性,从而能够提升对重复事件检索的准确性。
可选地,作为一个实施例,在步骤130之后,服务器可以在确定存在第二事件的情况下,呈现第二事件的特征信息。
服务器可以将步骤130确定第二事件的特征信息进行呈现,以便于用户根据呈现的信息进行判断。
可选地,作为另一实施例,第一事件的关键内容信息可以包括第一事件的关键词所对应的词义。服务器可以根据关键词数据库,在第一事件的记录信息中提取第一事件的关键词,关键词数据库用于存储至少一个关键词。然后服务器可以根据词义数据库以及第一事件的关键词,确定第一事件的关键词所对应的词义,词义数据库用于存储至少一个关键词分别对应的词义。
为了便于在事件数据库中将所述第一事件的特征信息进行匹配,服务器可以将记录信息转化为属于结构化数据的特征信息。服务器可以直接从记录信息中提取第一事件的记录时间和属性,并且重点将属于非结构化数据的第一事件的内容说明转化为结构化数据,也就是转化为第一事件的关键内容信息,关键内容信息可以包括第一事件的关键词所对应的词义。
具体地,服务器可以根据关键词数据库,提取第一事件的关键词。其中关键词数据库用于存储至少一个关键词,这些关键词可以是指能够表达事件主要含义的词汇。对于不同的事件,关键词可以不同。例如,在与城管相关的事件中,关键词可以包括噪声或摆地摊等类似词汇。在与公安相关的事件中,关键词可以包括打架或抢劫等类似词汇。
关键词数据库可以是在服务器中预先配置的,也可以是通过统计得到的。例如,服务器可以统计各项历史事件的内容说明中出现频率较高的词汇,将这些词汇存储在关键词数据库中。
在关键词数据库中,关键词也可以是拼音的模式。在事件的记录信息采集的过程中,可能会出现错别字。通过关键词采用拼音的模式,服务器能够识别关键词中拼音相同的错别字,从而能够提升重复事件的检索准确性。
由于不同的关键词可能表达同样的含义,例如噪声、噪音和吵杂三者表达同样的含义,因此,为了能够对第一事件的关键内容信息进行匹配,可以确定关键词对应的词义。表达同样含义的关键词可以对应于同一词义,这样,能够有效提高第二事件与第一事件的匹配准确度,并能够提高重复事件的检索效率。
可选地,作为另一实施例,服务器可以确定第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定第一事件的属性是否与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率是否大于预设的阈值。服务器可以在确定第一事件的记录时间和第三事件的记录事件是否在上述时间区间内,确定第一事件的属性与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率大于阈值的情况下,确定第三事件为第二事件。
服务器可以对第一事件的记录时间、第一事件的属性和第一事件的关键内容信息分别进行匹配,从而确定是否存在第二事件。
可选地,作为另一实施例,第三事件的关键内容信息包括第三事件的关键词所对应的词义。服务器可以确定第一事件的关键词所对应的词义与第三事件的关键词所对应的词义之间的匹配率是否大于阈值。
例如,第一事件的记录信息可以包括:2012年9月4日A街道工地经常晚上施工,噪声扰民。
服务器可以根据第一事件的记录信息确定第一事件的特征信息。例如,第一事件的特征信息可以包括:第一事件的记录时间“2012-9-4”,第一事件的发生地点为“A街道”,第一事件的关键内容信息“施工,噪音”。
假设在事件数据库中,第三事件的特征信息包括:第三事件的记录时间“2012-9-6”,第三事件的发生地点“A街道”,第三事件的关键内容信息“施工,噪音”。
假设预设的时间区间为7天,那么第三事件的特征信息与第一事件的特征信息是匹配的,因此可以确定第三事件为上述与第一事件匹配的第二事件。
可选地,作为另一实施例,服务器可以在确定存在第二事件的情况下,确定第一事件的反映人信息和第二事件的反映人信息。服务器可以在确定第一事件的反映人信息与第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现第一提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人相同。服务器可以在确定第一事件的反映人信息与第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现第二提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人不相同。
反映人信息可以用于指示反映人的属性,例如,反映人信息可以包括反映人联系电话、电子邮箱或者证件号码等。因此,反映人信息可以是结构化数据。
在第一事件的反映人信息与第二事件的反映人信息匹配的情况下,服务器可以通过第一提示信息,向用户提示同一人多次反映同一事件。在第一事件的反映人信息与第二事件的反映人信息不匹配的情况下,服务器可以通过第二提示信息来向用户提示不同人多次反映同一事件。
此外,服务器还可以根据事件数据库中存储的至少一项事件的特征信息,进行事件统计。例如,可以统计与“噪音”相关的事件数量,从而辅助用户进行事件的处理。
图2是根据本发明实施例的服务器的示意框图。图2的服务器200包括获取单元210、确定单元220和匹配单元230。
获取单元210获取第一事件的记录信息,第一事件的记录信息用于描述第一事件。确定单元220根据第一事件的记录信息,确定第一事件的特征信息,第一事件的特征信息属于结构化数据,第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息。匹配单元230在事件数据库中对第一事件的特征信息进行匹配,以确定在事件数据库中是否存在与第一事件相匹配的第二事件,事件数据库用于存储至少一项事件的特征信息。
本发明实施例中,通过根据第一事件的记录信息确定属于结构化数据的第一事件的特征信息,并对第一事件的特征信息进行匹配来确定在事件数据库中是否存在与第一事件相匹配的第二事件,其中第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息,从而能够提升第二事件与第一事件的匹配准确性,从而能够提升对重复事件检索的准确性。
可选地,作为一个实施例,第一事件的关键内容信息包括第一事件的关键词所对应的词义。确定单元220可以根据关键词数据库,在第一事件的记录信息中提取第一事件的关键词,关键词数据库用于存储至少一个关键词,并可以根据词义数据库以及第一事件的关键词,确定第一事件的关键词所对应的词义,词义数据库用于存储至少一个关键词分别对应的词义。
可选地,作为另一实施例,匹配单元230可以确定第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定第一事件的属性是否与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率是否大于预设的阈值。匹配单元230可以在确定第一事件的记录时间和第三事件的记录事件在时间区间内,确定第一事件的属性与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率大于阈值的情况下,确定第三事件为第二事件。
可选地,作为另一实施例,第三事件的关键内容信息包括第三事件的关键词所对应的词义。匹配单元230可以确定第一事件的关键词所对应的词义与第三事件的关键词所对应的词义之间的匹配率是否大于阈值。
可选地,作为另一实施例,服务器200还可以包括第一呈现单元240。第一呈现单元240可以在确定存在第二事件的情况下,呈现第二事件的特征信息。
可选地,作为另一实施例,服务器200还可以包括第二呈现单元250。
确定单元220还可以在确定存在第二事件的情况下,确定第一事件的反映人信息和第二事件的反映人信息。第二呈现单元250可以在确定第一事件的反映人信息与第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现第一提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人相同。第二呈现单元250还可以在确定第一事件的反映人信息与第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现第二提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人不相同。
服务器200的其它功能和操作可以参照图1的方法实施例的过程,为了避免重复,此处不再赘述。
图3是根据本发明另一实施例的服务器的示意框图。图3的服务器300包括存储器310和处理器。
存储器310可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器320可以是中央处理器(CentralProcessing Unit,CPU)。
存储器310用于存储可执行指令。处理器320可以执行存储器310中存储的可执行指令,用于:获取第一事件的记录信息,第一事件的记录信息用于描述第一事件;根据第一事件的记录信息,确定第一事件的特征信息,第一事件的特征信息属于结构化数据,第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息;在事件数据库中对第一事件的特征信息进行匹配,以确定在事件数据库中是否存在与第一事件相匹配的第二事件,事件数据库用于存储至少一项事件的特征信息。
本发明实施例中,通过根据第一事件的记录信息确定属于结构化数据的第一事件的特征信息,并对第一事件的特征信息进行匹配来确定在事件数据库中是否存在与第一事件相匹配的第二事件,其中第一事件的特征信息包括第一事件的记录时间、第一事件的属性和第一事件的关键内容信息,从而能够提升第二事件与第一事件的匹配准确性,从而能够提升对重复事件检索的准确性。
可选地,作为一个实施例,第一事件的关键内容信息包括第一事件的关键词所对应的词义。处理器320可以根据关键词数据库,在第一事件的记录信息中提取第一事件的关键词,关键词数据库用于存储至少一个关键词,并可以根据词义数据库以及第一事件的关键词,确定第一事件的关键词所对应的词义,词义数据库用于存储至少一个关键词分别对应的词义。
可选地,作为另一实施例,处理器320可以确定第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定第一事件的属性是否与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率是否大于预设的阈值。处理器320可以在确定第一事件的记录时间和第三事件的记录事件在时间区间内,确定第一事件的属性与第三事件的属性相同,且确定第一事件的关键内容信息与第三事件的关键内容信息的匹配率大于阈值的情况下,确定第三事件为第二事件。
可选地,作为另一实施例,第三事件的关键内容信息包括第三事件的关键词所对应的词义。处理器320可以确定第一事件的关键词所对应的词义与第三事件的关键词所对应的词义之间的匹配率是否大于阈值。
可选地,作为另一实施例,处理器320可以在确定存在第二事件的情况下,呈现第二事件的特征信息。
可选地,作为另一实施例,处理器320还可以在确定存在第二事件的情况下,确定第一事件的反映人信息和第二事件的反映人信息。处理器320可以在确定第一事件的反映人信息与第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现第一提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人相同。处理器320还可以在确定第一事件的反映人信息与第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现第二提示信息,其中第一提示信息用于指示第一事件的反映人与第二事件的反映人不相同。
服务器300的其它功能和操作可以参照图1的方法实施例的过程,为了避免重复,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (12)
1.一种处理数据的方法,其特征在于,包括:
获取第一事件的记录信息,所述第一事件的记录信息用于描述所述第一事件;
根据所述第一事件的记录信息,确定第一事件的特征信息,所述第一事件的特征信息属于结构化数据,所述第一事件的特征信息包括所述第一事件的记录时间、所述第一事件的属性和所述第一事件的关键内容信息;
在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,所述事件数据库用于存储至少一项事件的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述第一事件的关键内容信息包括所述第一事件的关键词所对应的词义;
所述根据所述第一事件的记录信息,确定第一事件的特征信息,包括:
根据关键词数据库,在所述第一事件的记录信息中提取所述第一事件的关键词,所述关键词数据库用于存储至少一个关键词;
根据词义数据库以及所述第一事件的关键词,确定所述第一事件的关键词所对应的词义,所述词义数据库用于存储所述至少一个关键词分别对应的词义。
3.根据权利要求2所述的方法,其特征在于,所述在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,包括:
确定所述第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定所述第一事件的属性是否与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值;
在确定所述第一事件的记录时间和第三事件的记录事件在所述时间区间内,确定所述第一事件的属性与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率大于所述阈值的情况下,确定所述第三事件为所述第二事件。
4.根据权利要求3所述的方法,其特征在于,所述第三事件的关键内容信息包括所述第三事件的关键词所对应的词义;
确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值,包括:
确定所述第一事件的关键词所对应的词义与所述第三事件的关键词所对应的词义之间的匹配率是否大于所述阈值。
5.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:
在确定存在所述第二事件的情况下,呈现所述第二事件的特征信息。
6.根据权利要求1至5中任一项所述的方法,其特征在于,还包括:
在确定存在所述第二事件的情况下,确定所述第一事件的反映人信息和所述第二事件的反映人信息;
在确定所述第一事件的反映人信息与所述第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现所述第一提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人相同;
在确定所述第一事件的反映人信息与所述第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现所述第二提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人不相同。
7.一种服务器,其特征在于,包括:
获取单元,用于获取第一事件的记录信息,所述第一事件的记录信息用于描述所述第一事件;
确定单元,用于根据所述第一事件的记录信息,确定第一事件的特征信息,所述第一事件的特征信息属于结构化数据,所述第一事件的特征信息包括所述第一事件的记录时间、所述第一事件的属性和所述第一事件的关键内容信息;
匹配单元,用于在事件数据库中对所述第一事件的特征信息进行匹配,以确定在所述事件数据库中是否存在与所述第一事件相匹配的第二事件,所述事件数据库用于存储至少一项事件的特征信息。
8.根据权利要求7所述的服务器,其特征在于,所述第一事件的关键内容信息包括所述第一事件的关键词所对应的词义;
所述确定单元,具体用于:
根据关键词数据库,在所述第一事件的记录信息中提取所述第一事件的关键词,所述关键词数据库用于存储至少一个关键词;
根据词义数据库以及所述第一事件的关键词,确定所述第一事件的关键词所对应的词义,所述词义数据库用于存储所述至少一个关键词分别对应的词义。
9.根据权利要求8所述的服务器,其特征在于,所述匹配单元,具体用于:
确定所述第一事件的记录时间和第三事件的记录时间是否均在预设的时间区间内,确定所述第一事件的属性是否与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率是否大于预设的阈值;
在确定所述第一事件的记录时间和第三事件的记录事件在所述时间区间内,确定所述第一事件的属性与所述第三事件的属性相同,且确定所述第一事件的关键内容信息与所述第三事件的关键内容信息的匹配率大于所述阈值的情况下,确定所述第三事件为所述第二事件。
10.根据权利要求9所述的服务器,其特征在于,所述第三事件的关键内容信息包括所述第三事件的关键词所对应的词义;
所述匹配单元,具体用于:
确定所述第一事件的关键词所对应的词义与所述第三事件的关键词所对应的词义之间的匹配率是否大于所述阈值。
11.根据权利要求7至10中任一项所述的服务器,其特征在于,还包括:
第一呈现单元,用于在确定存在所述第二事件的情况下,呈现所述第二事件的特征信息。
12.根据权利要求7至11中任一项所述的服务器,其特征在于,还包括第二呈现单元;
所述确定单元,还用于在确定存在所述第二事件的情况下,确定所述第一事件的反映人信息和所述第二事件的反映人信息;
所述第二呈现单元,用于在确定所述第一事件的反映人信息与所述第二事件的反映人信息匹配的情况下,生成第一提示信息,并呈现所述第一提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人相同;
所述第二呈现单元,还用于在确定所述第一事件的反映人信息与所述第二事件的反映人信息不匹配的情况下,生成第二提示信息,并呈现所述第二提示信息,其中所述第一提示信息用于指示所述第一事件的反映人与所述第二事件的反映人不相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310268687.2A CN104252488B (zh) | 2013-06-28 | 2013-06-28 | 处理数据的方法和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310268687.2A CN104252488B (zh) | 2013-06-28 | 2013-06-28 | 处理数据的方法和服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104252488A true CN104252488A (zh) | 2014-12-31 |
CN104252488B CN104252488B (zh) | 2017-12-22 |
Family
ID=52187389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310268687.2A Active CN104252488B (zh) | 2013-06-28 | 2013-06-28 | 处理数据的方法和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104252488B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934038A (zh) * | 2017-03-15 | 2017-07-07 | 江苏华生基因数据科技股份有限公司 | 一种医疗数据查重和关联的方法及*** |
CN107729337A (zh) * | 2016-08-11 | 2018-02-23 | 北京国双科技有限公司 | 事件的监测方法和装置 |
CN110378378A (zh) * | 2019-06-17 | 2019-10-25 | 北京百度网讯科技有限公司 | 事件检索方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080059509A1 (en) * | 2004-06-11 | 2008-03-06 | Sony Corporation | Data Processing Device, Data Processing Method, Program, Program Recording Medium, Data Recording Medium, and Data Structure |
CN101533396A (zh) * | 2008-03-11 | 2009-09-16 | 英业达股份有限公司 | 一种记录查询历程的查询***及其方法 |
CN102402563A (zh) * | 2010-09-19 | 2012-04-04 | 腾讯科技(深圳)有限公司 | 网络信息筛选方法和装置 |
-
2013
- 2013-06-28 CN CN201310268687.2A patent/CN104252488B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080059509A1 (en) * | 2004-06-11 | 2008-03-06 | Sony Corporation | Data Processing Device, Data Processing Method, Program, Program Recording Medium, Data Recording Medium, and Data Structure |
CN101533396A (zh) * | 2008-03-11 | 2009-09-16 | 英业达股份有限公司 | 一种记录查询历程的查询***及其方法 |
CN102402563A (zh) * | 2010-09-19 | 2012-04-04 | 腾讯科技(深圳)有限公司 | 网络信息筛选方法和装置 |
Non-Patent Citations (1)
Title |
---|
黄子越等: "XML检索中基于聚类的查询词扩展", 《电子科技大学学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107729337A (zh) * | 2016-08-11 | 2018-02-23 | 北京国双科技有限公司 | 事件的监测方法和装置 |
CN107729337B (zh) * | 2016-08-11 | 2020-05-22 | 北京国双科技有限公司 | 事件的监测方法和装置 |
CN106934038A (zh) * | 2017-03-15 | 2017-07-07 | 江苏华生基因数据科技股份有限公司 | 一种医疗数据查重和关联的方法及*** |
CN106934038B (zh) * | 2017-03-15 | 2018-01-05 | 江苏华生基因数据科技股份有限公司 | 一种医疗数据查重和关联的方法及*** |
CN110378378A (zh) * | 2019-06-17 | 2019-10-25 | 北京百度网讯科技有限公司 | 事件检索方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104252488B (zh) | 2017-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109254966B (zh) | 数据表查询方法、装置、计算机设备及存储介质 | |
US9904694B2 (en) | NoSQL relational database (RDB) data movement | |
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
TW202029079A (zh) | 異常群體識別方法及裝置 | |
US8775423B2 (en) | Data mining across multiple social platforms | |
US11907659B2 (en) | Item recall method and system, electronic device and readable storage medium | |
CN104239373A (zh) | 为文档添加标签的方法及装置 | |
KR102144868B1 (ko) | 통화 기록 제공 장치 및 방법 | |
US9754023B2 (en) | Stochastic document clustering using rare features | |
CN104270605B (zh) | 一种视频监控数据的处理方法及装置 | |
CN109918678B (zh) | 一种字段含义识别方法和装置 | |
CN108628885B (zh) | 一种数据同步方法、装置及存储设备 | |
CN105446572A (zh) | 一种用于屏幕显示设备的文字编辑方法及装置 | |
CN107832440A (zh) | 一种数据挖掘方法、装置、服务器及计算机可读存储介质 | |
CN104298654A (zh) | 用于显示信息的方法、装置 | |
CN104252488A (zh) | 处理数据的方法和服务器 | |
US9984108B2 (en) | Database joins using uncertain criteria | |
CN112363996B (zh) | 用于建立电网知识图谱的物理模型的方法及***和介质 | |
CN104240107A (zh) | 社群数据筛选***及其方法 | |
CN104102411A (zh) | 一种文本编辑方法和文本编辑装置 | |
CN104424109A (zh) | 一种信息处理方法及电子设备 | |
US9286349B2 (en) | Dynamic search system | |
CN107315806B (zh) | 一种基于文件***的嵌入式存储方法和装置 | |
CN106776607B (zh) | 搜索引擎操作行为处理方法和装置 | |
CN107203621A (zh) | 一种基于拼音首字母的查询方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220829 Address after: No. 1899 Xiyuan Avenue, high tech Zone (West District), Chengdu, Sichuan 610041 Patentee after: Chengdu Huawei Technologies Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |