CN101566995A - 一种互联网信息整合发布的方法和*** - Google Patents

一种互联网信息整合发布的方法和*** Download PDF

Info

Publication number
CN101566995A
CN101566995A CNA2008101050657A CN200810105065A CN101566995A CN 101566995 A CN101566995 A CN 101566995A CN A2008101050657 A CNA2008101050657 A CN A2008101050657A CN 200810105065 A CN200810105065 A CN 200810105065A CN 101566995 A CN101566995 A CN 101566995A
Authority
CN
China
Prior art keywords
neologisms
new words
internet
internet new
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008101050657A
Other languages
English (en)
Inventor
张扬
林凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CNA2008101050657A priority Critical patent/CN101566995A/zh
Publication of CN101566995A publication Critical patent/CN101566995A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种互联网信息整合发布的方法、装置和***,所述方法包括以下步骤:获取互联网新词;获取针对互联网新词自身属性的描述信息;获取与互联网新词相关的服务资源;展现互联网新词;接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。本发明可以从互联网的各种资源中挖掘新词及其相关的各种信息,并采用多种方式将新词相关的各种信息及发现过程展现给用户;将这些新潮热门词汇及其相关信息及时展现给终端用户,能够帮助用户及时获取互联网最新动向,增进互联网新鲜信息的获取和传播速度。

Description

一种互联网信息整合发布的方法和***
技术领域
本发明涉及互联网信息传播技术领域,特别是涉及一种互联网信息整合发布的方法和***。
背景技术
目前随着互联网技术应用的越来越广泛,人们很多的日常工作和娱乐都在网络上进行,人们所能够获取的互联网信息数量也出现***式的增长。在人们的信息获取习惯中,通常都存在对新鲜信息及时获取的需求。
其中,新鲜信息可以包括针对当前时间点的各种新闻信息、观点文章等信息,这些信息可以通过门户网站等互联网信息接入口实现获取,例如,搜狐、新浪等门户网站会及时更新其网站中的各种信息,以满足用户及时获取的需求。用户通过登陆某个门户网站,可以获取其所提供的针对当前时间点的各种信息。
但是,当用户并不是希望在信息广度上获取当前时间点下的各种新鲜信息,而是希望在信息深度上获取某个专题在近一段时间上的各种相关信息,或者希望了解某个对该用户而言的新鲜事件,以及该事件在一段时间上的各种相关信息,则通过上述方式就无法实现了。并且,实际上,用户对于后一类信息的获取需求更为强烈一些。如,对于互联网新词就是这样,用户在浏览某些信息时或者从朋友处,得知了一个互联网新词(对于该用户而言),但是却不明白其具体情况,则就希望找到与该互联网新词相关的各种信息,以作进一步了解。本发明的所述新词可以包括:人们在日常生活中因接触各种新生事物而总结出来的、大量使用并广为传播的词条,包括新潮词汇、新闻人物、重大事件、专为某一类人群使用的特定称谓等。新词一般具有被广为使用、长期流行、口语缩略化等特点,如“***”、“路演”、“次贷”、“轰趴”、“博斗”、“抱抱团”等。
为了满足上述需求,用户可以通过各种信息链接的方式(如,相关新闻推荐、相关文章推荐等),从一个信息链接到其他相关信息,获取与该互联网新词相关的各种信息。但是,通常的信息链接数量有限,并且对于超过两级的链接而言,其与原始信息的相关性会明显下降,因此,在该方式下,用户需要花费很多的精力在信息获取过程上,效率明显低下。
随着互联网信息搜索引擎技术的发展,人们为了获取与该互联网新词相关的各种信息,越来越多的通过关键词搜索技术来实现。但是该方式也存在很多缺陷:首先,用户必须要知道该新词的存在,才能进行后续的搜索查询,而在很多情况下,用户并不知道该新词的存在,即该方式仍然在一定程度上限制了与该新词相关的各种新鲜信息在互联网上的传播速度;其次,虽然搜索结果与该新词有一定的相关度,但是各条搜索结果与该新词的相关程度不一、信息描述维度不一,所以需要用户阅读大量搜索结果之后,才能比较全面的了解该新词,信息获取效率仍然比较低下。
总之,迫切需要本领域技术人员迫切解决的一个技术问题就是:如何能够创造性的提出一种能够增进互联网新鲜信息传播速度的信息发布方案。
发明内容
本发明所要解决的技术问题是提供一种互联网信息整合发布的解决方案,通过该解决方案,挖掘出互联网各种信息、服务与互联网新词的关系,以互联网新词为核心将各种相关信息整合起来集中发布,从而可以增进以互联网新词为核心的相关新鲜信息的传播速度,提高用户的信息获取效率。
为了解决上述问题,本发明公开了一种互联网信息整合发布的方法,包括:获取互联网新词;获取针对互联网新词自身属性的描述信息;获取与互联网新词相关的服务资源;展现互联网新词;接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
优选的,可以通过以下方式获取互联网新词:获取新词候选;依据预置新词特征,对所述新词候选进行筛选,获取新词。
优选的,所述新词特征包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。
优选的,所述新词特征也可以包括时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。
优选的,可以通过以下方式获取与互联网新词相关的服务资源:在各种类型的服务资源集合中查询获取与相应互联网新词相关的服务资源;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
优选的,可以通过用户端应用程序或者应用程序插件展现互联网新词;或者,也可以通过网站页面方式展现互联网新词。
优选的,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
依据本发明的另一优选实施例,还公开了一种互联网信息整合发布的***,包括:
用于获取互联网新词的单元;
用于获取针对互联网新词自身属性的描述信息的单元;
用于获取与互联网新词相关的服务资源的单元;
用于展现互联网新词的单元;
发布单元,用于接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
优选的,所述用于获取互联网新词的单元可以进一步包括:新词候选单元,用于获取新词候选;筛选单元,用于依据预置新词特征,对所述新词候选进行筛选,获取新词。
优选的,所述新词特征包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。
优选的,所述新词特征也可以包括时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。
优选的,所述与互联网新词相关的服务资源通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
优选的,所述用于展现互联网新词的单元采用用户端应用程序或者应用程序插件展现互联网新词;或者,也可以采用网站页面方式展现互联网新词。
优选的,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
依据本发明的另一优选实施例,还公开了一种互联网信息整合发布的装置,包括:
新词信息数据库,用于存储互联网新词、针对互联网新词自身属性的描述信息、与互联网新词相关的服务资源信息,以及三者之间的映射关系;
接口模块,用于展现互联网新词,以及接收用户针对一互联网新词的信息获取请求;
发布模块,用于当收到针对一互联网新词的信息获取请求时,从所述新词信息数据库获取和发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
优选的,所述与互联网新词相关的服务资源通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
优选的,所述接口模块采用用户端应用程序或者应用程序插件展现互联网新词;或者,也可以采用网站页面方式展现互联网新词。
优选的,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
优选的,所述针对互联网新词自身属性的描述信息也可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
与现有技术相比,本发明具有以下优点:
本发明从互联网的各种资源中挖掘新词及其相关的各种信息,并采用多种方式将新词相关的各种信息及发现过程展现给用户;将这些新潮热门词汇及其相关信息及时展现给终端用户,能够帮助用户及时获取互联网最新动向,增进互联网新鲜信息的获取和传播速度。
其次,本发明在相关信息的展现过程中,以互联网新词为核心整合了服务提供商提供的各种服务,为用户提供了一个非常贴近需求的信息综合接口,因此本发明可以明显改善服务质量,提升用户访问量,增强用户忠诚度,加快服务推送速度以及增强用户满意度。
附图说明
图1是本发明一种互联网信息整合发布的方法实施例的步骤流程图;
图2是本发明一种互联网信息整合发布的***实施例的结构框图;
图3是本发明一种互联网信息整合发布***的具体实现优选实施例的结构关系图;
图4是本发明一种新词提示的界面示意图;
图5是本发明一种互联网信息整合发布的装置实施例的结构框图;
图6是本发明一个针对具体新词“王栎鑫”发布相关信息的界面示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
参照图1,示出了本发明一种互联网信息整合发布的方法实施例,具体可以包括以下步骤:
步骤101、获取互联网新词。
步骤102、获取针对互联网新词自身属性的描述信息。
步骤103、获取与互联网新词相关的服务资源。
具体的,可以通过以下方式获取与互联网新词相关的服务资源:在各种类型的服务资源集合中查询获取与相应互联网新词相关的服务资源;所述服务资源类型可以包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。总之,通过步骤101、102和103可以建立一互联网新词、针对其自身属性的描述信息以及与其相关的各种服务资源之间的映射关系。
步骤104、展现互联网新词。
具体的,可以通过用户端应用程序或者应用程序插件展现互联网新词;也可以通过网站页面方式展现互联网新词。
例如,可以建立一个新词发布主页,以时间、活跃度、类别或者以拼音首字母等等为索引,展示近两年内的互联网新词(即PULL模式)。当然,每个新词后面都映射有针对其自身属性的描述信息以及与其相关的服务资源。用户可以通过该新词发布主页,浏览或者查询自己所需的新词,进而通过步骤105获取该新词的各种相关信息;不需要用户再通过手动搜索、筛选、分析获取该新词的各种相关信息,提高了信息传播的速度。
再例如,还可以采用***桌面弹出栏、输入法/即时聊天/桌面搜索软件的新词更新提示、聚合内容(RSS)信息推送提示等方式,展示本月内的互联网新词(即PUSH模式)等等。由于这种方式主要用于新词提示,无法展示大量新词,因此,一般可以用于向用户推荐最新的新词或者该用户定制的新词,该方式具有更新及时、方式简洁等特点。用户可以简单浏览所展现的新词,从而确定其是否需要进一步了解其背后很多的相关信息;如果需要,则点击链接,就可以进入步骤105。
当然,步骤104除了仅仅展示新词本身,在容量允许的情况下,还可以展现一些简单的描述信息,例如该新词的标签、类别等等。
下面对聚合内容RSS进行简单介绍。
聚合内容RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。用于本发明的RSS,其实现大致可以分为以下两类:
第一类RSS阅读器可以为运行在计算机桌面上的应用程序,通过所订阅新词供应,可自动、定时地更新新词提示。现有技术中已经提出了针对新闻阅读的RSS阅读器,如Awasu、FeedDemon和RSSReader;以及,周博通,看天下,博阅等等多款RSS阅读器,所以具体实现细节在此就不再详述。
第二类RSS阅读器可以为内嵌于已在计算机中运行的应用程序中。例如,本发明可以将RSS阅读器的功能内嵌在输入法/即时聊天/桌面搜索软件/浏览器中;当后台分析得到了用户所定制的新词时(如娱乐领域的新词),或者缺省模式下的服务器端新词自动更新时,则弹出浮动窗口进行提示。
步骤105、接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
一般的,步骤105所进一步发布的信息可以采用独立新窗口或者新网页的方式发布。如果在该网页中可以直接发布相关服务资源,则直接发布即可,例如搜索结果列表或者定制服务的定制需求输入窗口等等;如果无法直接发布相关服务资源,则可以发布其链接,例如相关博客、游戏或者桌面产品等等。
下面对步骤101如何获取互联网新词进行简单介绍。
本发明可以采用各种方式获取新词,如,可以采用已公开专利文件所提及的各种获取方式,具体情况在此不再赘述。下面给出一种本发明可能的实现方式:
A、获取新词候选;
获取新词候选的方式也可以是多种多样的。
例如,可以通过收集互联网语料,去除噪音后分词;然后对各个分词结果在标准词典中进行匹配,如果在标准词典中不存在,则可以确定该分词结果为一个新词候选。
再例如,可以从查询日志中收集用户的查询词,筛选得到一批查询频率符合要求的查询词;然后分别对这些查询词在标准词典中进行匹配,如果在标准词典中不存在,则可以确定该查询词为一个新词候选。
再例如,可以收集输入法用户词库中的新词(一般而言,这些新词都是标准词典中没有的)及其输入次数,如果输入次数高于一定阈值,则可以确定该词为一个新词候选。
B、依据预置新词特征,对所述新词候选进行筛选,获取新词。
在具体实现中,由于新词筛选所考虑因素的不同,所依据的新词特征也可能不同,下面给出本发明可能涉及的一些新词特征。
在本发明的一个优选实施例中,所述新词特征可以包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。优选的,这三者都符合一定条件时,才将该新词候选确定为一个合格的新词。
同时,可能还需要考虑时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。因为新词一般都是突然出现的,并且由于其在一定范围内的传播,所以在一段时间内,新词的使用率是呈现平稳增长的特性的;所以本发明可以采用上述的时间特征来筛选新词。
需要说明的是,本发明的新词特征还可能涉及语法特征、信息学特征、新闻标题命中或者垃圾词命中等特征,在后面的具体例子中再详细介绍。
下面对步骤102所得到的描述信息进行简单介绍。
所述针对互联网新词自身属性的描述信息,其目的就是帮助用户更好的了解该新词。由于描述角度的不同,所述描述信息可能具有多样性,下面简单举例说明。
在本发明的一个优选实施例中,所述针对互联网新词自身属性的描述信息可以包括有新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。例如,在该新词前后相邻之处包括词汇:“是指”、“来源”、“定义”、“为”字样的,则可以将整句或者整段抽取出来,作为该新词的定义。当然,为了精确起见,还可以采用人工校正或者采用用户上传的方式获取该新词的定义。
在本发明的另一个优选实施例中,所述针对互联网新词自身属性的描述信息还可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
例如,X轴为时间轴,Y轴为用户查询次数轴,则绘制出来的趋势图可以表示该新词在一段时间内,在搜索查询维度上的变换趋势。用户新词点击是本发明的一个用户反馈维度,具体是指应用本发明后,用户点击查看该新词相关信息的次数或频率,则可以在一定程度上反馈用户对该新词的关注度,所以可以将该反馈信息也记录到针对该新词的属性描述信息中。
为了更直观展示在各个维度下的新词属性,也可以采用评价参数的方式实现,如:A维度(8分);B维度(9分);C维度(8.5分)等等,用户可以一目了然,同时查看该新词在各个维度上的情况。
在本发明的另一个优选实施例中,所述针对互联网新词自身属性的描述信息还可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串可以通过汇总、分析用户编码字符串的输入情况而获得。因为一般的对于样本数量庞大的输入法用户群体而言,输入正确编码字符串的频率会远远高于输入错误编码字符串的频率,因此,可以通过汇总、分析用户编码字符串的输入情况而获得该新词的正确编码字符串。
例如,在某些情况下,用户可能并不清楚对于某个新词,如果通过键盘输入时(如,与其他用户的信息交互),其正确的编码字符串应该是怎样的(例如,对于拼音输入法,不知道其读音);通过本属性描述信息的展示,可以帮助用户正确输入。当然,本例中的属性描述信息主要针对中、日、韩等非罗马字符;如果将本发明应用在罗马字符语言上,则可以不应用本例中的属性描述信息。
参照图2,示出了本发明一种互联网信息整合发布的***实施例,具体可以包括以下部件:
新词获取单元201,用于获取互联网新词;
描述信息获取单元202,用于获取针对互联网新词自身属性的描述信息;
服务资源获取单元203,用于获取与互联网新词相关的服务资源;所述与互联网新词相关的服务资源可以通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型可以包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务等;
新词展现单元204,用于展现互联网新词;可以采用用户端应用程序或者应用程序插件展现互联网新词;或者,采用网站页面方式展现互联网新词;即本发明即可以应用服务器端推送(push)的方式,也可以采用用户主动查询的情况(pull模式);
发布单元205,用于接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
在本发明的另一个优选实施例中,所述用于获取互联网新词的单元201进一步包括:新词候选单元,用于获取新词候选;筛选单元,用于依据预置新词特征,对所述新词候选进行筛选,获取新词。其中,所述新词特征可以包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。优选的是,所述新词特征还可以包括时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。
在本发明的另一个优选实施例中,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。进一步,所述针对互联网新词自身属性的描述信息还可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。在一些情况下,所述针对互联网新词自身属性的描述信息还可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
由于图2所示的***实施例是相应于图1所示的方法实施例的,本例未详述之处请参见前述方法实施例相关描述即可。
参照图3,示出了本发明一种互联网信息整合发布***的具体实现优选实施例,具体可以包括以下部件:
语料定向抓取模块301:用于从定向来源获取文本数据,例如,可能出现新词的互联网信息来源。具体的,可以包括网页、新闻、论坛、博客等网页语料;用户查询日志;输入法用户词库;用户语音聊天样本(需要通过语音到文本的转换);聊天记录语料等等。需要说明的是,涉及用户数据的抓取过程不应涉及具体用户的隐私。
语料定向抓取模块301的具体获取语料的方式可以是使用定向网络蜘蛛(focused crawler)抓取,或者从匿名用户数据(如输入法用户词库、聊天记录等)的存储服务器中获得。对于定向网络蜘蛛抓取,站点的选取可以是指定站点抓取,也可以是基于抓取网页内容的分类点过滤。由于其并非本发明重点,在此不再详述。
数据净化预处理模块302:用于去除模块301所抓取的原始语料中的格式信息、干扰信息或其他与新词发现无关的数据(即噪音信息)。例如,去除网页的HTML标签,网页无效内容,过滤语音聊天记录噪音等,为生成新词候选做准备。
新词候选生成模块303:用于按照一定的规则方法生成新词候选,便于模块304、模块305所执行的验证过程;新词候选生成模块303相当于完成了新词的粗选。前面的实施例中已经介绍了几种可行的新词候选获取方式,在此不再赘述。
新词自动验证模块304。新词自动验证模块304用于在新词候选生成模块303之后做进一步的过滤,从新词候选中挑选出质量较高的词条,作为新词输出。本模块可根据实际应用需要设定相应判定原则对新词加以筛选和验证,例如,基于规则或者基于统计判别进行。新词自动验证模块304验证确认的新词可以交由新词数据存储模块306管理。新词自动验证模块304所涉及的新词特征,包括但不限于频率、时间分布特性、语法规则、上下文关键字、用户使用的广度和频度等,参见表1,详述如下。
表1新词验证模板
Figure A20081010506500171
具体的,对于频率特征中的搜索引擎查询计数维度而言,在优选实现时,既要考虑在查询日志中的出现次数,同时还要考虑该新词候选单独作为一个查询串的次数,后者可以提高新词成立的可能性。
再例如,对于频率特征中的(输入法等)用户词库统计维度而言,在优选实现时,既要考虑用户输入的次数,也要考虑该新词被用户使用时的地域性,同时还要考虑用户输入的绝对频率,以尽量的减少筛选偏差。
再例如,对于频率特征中的网页统计特征维度而言,在优选实现时,需要考虑该新词候选是更多的出现在论坛、博客等分类语料中,还是更多的出现在普通网页中,不同的网页分类具有不同的统计权重。同时,还需要考虑是否需要在时间上对该新词候选的语料来源作区别,例如,赋予近期所抓取的网页较高的新词权重。
总之,新词候选的验证是一个整合多种特征综合考虑的过程,因为每个候选可能同时具有若干个对判为新词有利和不利的特征。候选生成策略可以是规则或统计判别方法,确定每个新词特征的权重。如有必要,为了提高处理效率和质量,验证过程还可加入人工干预。
人工干预验证模块305(可选)。人工参与验证可以较大的提高新词发现的精度,并能提供反馈给新词自动验证模块304以改进模板规则,但是在互联网海量信息的情况下,主要工作还需要依靠新词自动验证模块304。
新词数据存储模块306。按实际应用对新词数据加以存储和组织,包括存储、分发、备份等功能。具体的,新词数据存储模块306可以将验证确认的新词加以存储和组织,优选的是,新词数据存储模块306还可以用于存储从描述信息获取模块307和服务资源获取模块308所获取的针对新词的属性描述信息和相应的服务资源信息,以便后续展现给用户时的调用。
描述信息获取模块307可以依据前述的各种实现方式获取针对新词自身属性的各种描述信息,具体不再重复。
服务资源获取模块308也可以依据前述的各种实现方式获取针对该新词可能提供的各种服务资源,具体不再重复。
由于单独的一个新词,对于普通用户而言往往是生涩难懂的,因此,需要描述信息获取模块307和服务资源获取模块308进一步加工并整合其他一些用户能够理解的信息和可能需要的服务资源,如新词的定义、来源、例句、类别、活跃时间、拼写方法和该新词曾出现的网页列表等;从而可向用户提供一个以新词为核心,整合了各种相关信息的综合服务接口,将这些信息之间的内在联系为用户挖掘出来,以提高用户的信息获取效率。
新词内部应用模块309。新词数据存储模块306中所存储的新词数据也可以被应用到一些内部服务(所述内部服务是针对直接面向用户的外部服务而言的)上,为各种内部应用提供服务。如搜索引擎的分词模块或者新词候选判定时的词典资源等等,新词的加入可以改善这些内部应用的效果。
用户端新词更新提示模块310。在本例中,从后台收集获取的新词数据,以定期同步的方式向用户进行更新提示,引起用户点击,转到新词相关信息的展现模块311-313。优选的是,可以将更新提示模块310嵌入在输入法应用中,在将新词更新到输入法词库的时候,将更新提示显示给用户。
新词集中展现模块311。用户通过对更新提示模块310的操作,触发新词集中展现模块311,由新词集中展现模块311负责将新词相关的详尽信息呈现给用户,该模块主要提供针对新词自身属性的描述信息,并可以提供相关服务资源或者服务资源的链接。
在线词典/词库wiki模块312。用户通过新词集中展现模块311所展示的服务资源或者其链接,可以触发模块312。在线词典/词库wiki模块312可以提供类似wiki/百科词典的新词展现功能,用户可以及时反馈、修正词条相关的错误或疏漏,同时建立自定义标签(tag),方便相同喜好用户的联系。
在本发明的一个实施例中,在线词典/词库wiki模块312的部分功能可以直接集成在新词集中展现模块311的展现界面中,方便用户直接调用。
专项服务资源展现模块313。例如,新词集中展现模块311可以直接提供相关新闻、个人主页、博客链接等,由专项服务资源展现模块313向用户提供相应的服务即可。
搜索结果页展现模块314。与专项服务资源展现模块313的原理相同,搜索结果页展现模块314负责为从新词集中展现模块311转来的搜索类新词查询提供搜索结果页。优选的是,搜索结果页展现模块314涉及的搜索服务可以是网页搜索、音乐/图片/视频/地图等专项搜索。比如一个新楼盘名称,提供地图搜索可以方便用户便捷的找到楼盘的具体方位。
用户帐户管理模块315。本例中,用户可能需要在若干个服务间切换跳转,用户帐户管理模块315能够为用户在各个服务间提供唯一标识,提供一站式服务,无需再次进行身份识别。例如,用户还可以通过本模块在自定义设置中定制、取消新词发现服务,并能及时地提供服务改进反馈,提升各项服务的质量。
下面给出一个本发明典型的应用场景:
1、用户甲打开一个聊天窗口,激活输入法软件,准备输入文字。该输入法的网络监控程序(常驻后台的一个监控程序,常称为daemon)通过调用***接口,接收远程监控服务器的更新信息。远程监控服务器发送请求到新词服务器,请求获取固定时间段内的新词。新词服务器返回的结果不为空,输入法监控程序由此得知有新词更新,于是通过远程监控服务器下载新词列表及相关信息,组织数据展现内容。
2、该输入法软件在显眼位置(例如,桌面右下角)弹出新词更新提示(参见图4),展现本周更新的新词列表、所属类别及设置,提供链接可供用户点击。图4示出了本周的新词推荐,并给出了各个新词的标签等信息,以便用户大致判断其是否需要了解某个新词;并且,图4还给出了该用户之前定制RSS服务的更新提示。用户甲扫了一眼,对其中的新词“轰趴”很感兴趣,但却不清楚它的具体意义,于是点击。
3、用户点击“轰趴”,触发打开浏览器,转到一个新词展现页面。在这个页面上,用户可以看到这个词条的:
a)定义:“轰趴其实就是英语home party中文谐音的简称,其真正的含义也就是私人举办的家庭聚会。兴起于美国,近年来在台湾非常流行,并逐渐传入大陆”。
b)词条使用情况统计:在输入法匿名用户词库的统计中,最近100天有170个用户一共输入了295次;在搜索引擎查询日志统计中,有233条查询包含了“轰趴”;查询词“轰趴”的时间属性从3个月前开始陡增,形成一个波峰,之后变得平稳;统计量积累到最近几天变得显著,于是后台的新词发现流程识别了这个新词。
4、用户甲意犹未尽,点击新词展现页面上的“相关新闻”的链接,浏览了一遍“轰趴”相关的新闻,发现很多都只是给出定义便戛然而止了,没有他想要的那些轰趴活动如何开展、网友办轰趴的心得体会等。
同时用户甲发现新词展现页面提示在wiki词典上没有收录这个词条,于是用户甲按照其获得的信息内容创建了这个词条,并加入了一个觉得有用的网页链接。
进一步,因为对搜索结果不满意,用户甲打开了新词展现页面上的反馈窗口,写下了自己的意见。
进一步,用户甲通过新词展现页面所提供的定制服务,订阅了查询词“轰趴”的搜索结果的RSS:如果搜索结果有更新,可以及时通知他。
优选的是,包括输入法、新词展现页面、搜索、wiki等服务可以都来自同一家服务提供商,用户在使用输入法时登录了通行证,省去了使用每个服务都要逐个登录的烦恼。
5、搜索***在获得这个用户的反馈后,可及时地使用自动或人工的方法改进搜索结果。
6、过了几天,搜索***抓取了新的“轰趴”相关网页。用户管理服务器的轮询机制发现查询词“轰趴”的搜索结果页获得更新,及时通知订阅查询词更新结果的所有用户(包括用户甲在内),在桌面弹出窗口提示其RSS订阅有更新(参照图4)。
参照图5,示出了本发明一种互联网信息整合发布的装置实施例,具体可以包括以下部件:
新词信息数据库501,用于存储互联网新词、针对互联网新词自身属性的描述信息、与互联网新词相关的服务资源信息,以及三者之间的映射关系;
接口模块502,用于展现互联网新词,以及接收用户针对一互联网新词的信息获取请求;所述接口模块502可以采用用户端应用程序或者应用程序插件展现互联网新词;或者,也可以采用网站页面方式展现互联网新词;
发布模块503,用于当收到针对一互联网新词的信息获取请求时,从所述新词信息数据库获取和发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。所述与互联网新词相关的服务资源通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
所述针对互联网新词自身属性的描述信息可以包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。优选的是,所述针对互联网新词自身属性的描述信息还可以包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。在一些情况下,所述针对互联网新词自身属性的描述信息也可以包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
参照图6,示出了本发明一个具体新词“王栎鑫”通过发布模块503发布相关信息的界面600的示意图。在该界面示意中,包括以下栏目:
定义栏601。可以直接提供从网页信息挖掘得到的关于新词“王栎鑫”的定义。或者,也可以仅仅从wiki词典获取定义,即当该新词在wiki词典中有相关定义时,则在定义栏提供wiki链接,否则提示用户可向wiki增加词条并提供定义编辑链接。
选取依据栏602。后台***对新词“王栎鑫”在各个维度方向上进行了评价,并给出了具体评分,因此,在选取依据栏中以一个用户友好的类似打分的方式给出选择的依据。
走势图栏603。展现了新词“王栎鑫”作为用户输入/查询/媒体报道的数目,每一个维度可以对应一条曲线。示意图中嵌入了一个新词“王栎鑫”作为查询词的走势图示意。
拼写栏604。展现王栎鑫“wangyuexin”和“wanglixin”两种拼法在用户中的使用比例,一般的用户输入高频的拼法就是正确的。当然,对于例外情况需要人工介入;如,词“张柏芝”就是一个例外,在用户输入统计中,其错误拼法(zhangbozhi)比正确拼法(zhangbaizhi)高。
用户输入/查询用的用法展现栏605。经过统计,新词“王栎鑫”不存在有价值的用法展现信息,所以在界面展示中该栏目应该为空;或者用于其他栏目信息的展示。但是本发明为了清楚说明,在图6所示的界面示意图中,该栏目采用新词“泪奔”的用法展现信息替代进行说明,给出了新词“泪奔”各种用法情况下的频率和使用人数等统计信息。
上述的五个界面栏目都是针对新词“王栎鑫”自身属性的描述信息。下面几个栏目是针对相关服务资源信息的展示。
博客栏606。新词“王栎鑫”属于“明星”标签,提供相关博客blog.sina.com.cn/wangyuexin911的链接,可展现该博客的最近更新。该博客可能是王栎鑫自己的博客,也可能是王栎鑫乐迷的博客。
网页搜索结果栏607。在图6的示意图中,该栏目给出一个缩微的返回结果(前3名),包括标题、链接和摘要等。当然,还可以依据该用户的个性化信息提供个性化搜索结果。
新词提交接口608。提供接口让用户主动提供新词,如可提供其他快男(参加娱乐节目“快乐男声”的歌手简称)的姓名,如俞灏明、苏醒、吉杰等。
用户帐号信息栏609。用于显示用户身份,方便收集用户信息和实现统一服务登录。
上面仅仅是给出了本发明的一个界面示意结构,还可能包括RSS订阅栏目、新词信息展现管理栏目等等。需要说明的是,实际展现页面的布局和版块内容是可以随意安排的,并且可能针对不同用户还可以实现个性化定制。各个模块栏目可以拖动,缩放,甚至可以按自己喜好增删。而且因为每个新词被打上的标签(tag)不同,展现的模块栏目类型也会有所不同,当然,一般走势图、词条定义、选取依据是必要的。例如,全是单音字的词条就不会被打上“多音词”tag,也就不会有“拼写”这栏。
总之,互联网信息的飞速发展,各种新概念、热门事件或人物也层出不穷。相应地,这些新概念、新事物也成为人们茶余饭后的谈资,如“周老虎”、“次贷”、“水立方”。而它们凭借口头传播,往往有缩略语的种种特点。尤其是在一些专属领域,这些术语更是让一般人看来无法领会,比如网络游戏中“国战”、“求组”、“奥法”、“回蓝”等;其他如“博斗”、“棒棒堂”等新词更像是包含有错别字。
另一方面,互联网上各种传统服务不断提升自身性能的同时,各种更具人性化的新应用也在不断涌现,但是如何能够提高这些新应用服务传播给各个用户的速度和力度,是需要尽快解决的问题。
本发明通过新词作为媒介,将各方面的信息都整合起来,既能够向用户提供针对新词的各种描述信息,便于用户了解新词,又能够向用户提供与这些新词密切相关的新应用,以尽可能通过一个综合接口满足用户针对某个新词的所有需求,提高用户寻求相关信息资源和服务资源的效率。通过本发明,用户能快速了解互联网动向,及时获取感兴趣的信息;而服务提供商能加速自身资源/服务的整合,扩大自身产品对用户的曝光程度,潜在地提升用户黏性,获得更多的商业机会,增加收益。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本发明所提供的一种互联网信息整合发布的方法、装置和***,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (24)

1、一种互联网信息整合发布的方法,其特征在于,包括:
获取互联网新词;
获取针对互联网新词自身属性的描述信息;
获取与互联网新词相关的服务资源;
展现互联网新词;
接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
2、如权利要求1所述的方法,其特征在于,通过以下方式获取互联网新词:
获取新词候选;
依据预置新词特征,对所述新词候选进行筛选,获取新词。
3、如权利要求2所述的方法,其特征在于,所述新词特征包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。
4、如权利要求2或3所述的方法,其特征在于,所述新词特征包括时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。
5、如权利要求1所述的方法,其特征在于,通过以下方式获取与互联网新词相关的服务资源:
在各种类型的服务资源集合中查询获取与相应互联网新词相关的服务资源;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
6、如权利要求1所述的方法,其特征在于,
通过用户端应用程序或者应用程序插件展现互联网新词;
或者,通过网站页面方式展现互联网新词。
7、如权利要求1所述的方法,其特征在于,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
8、如权利要求1所述的方法,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
9、如权利要求1所述的方法,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
10、一种互联网信息整合发布的***,其特征在于,包括:
用于获取互联网新词的单元;
用于获取针对互联网新词自身属性的描述信息的单元;
用于获取与互联网新词相关的服务资源的单元;
用于展现互联网新词的单元;
发布单元,用于接收用户针对一互联网新词的信息获取请求,发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
11、如权利要求10所述的***,其特征在于,所述用于获取互联网新词的单元进一步包括:
新词候选单元,用于获取新词候选;
筛选单元,用于依据预置新词特征,对所述新词候选进行筛选,获取新词。
12、如权利要求11所述的***,其特征在于,所述新词特征包括频率特征,所述频率特征包括:该新词候选作为查询词在搜索引擎日志中的计数、输入法用户使用该新词候选的情况统计、该新词候选在网页中的统计特征三者中的任意一个或者任意组合。
13、如权利要求11或12所述的***,其特征在于,所述新词特征包括时间特征,所述时间特征包括突发出现特性以及使用率平稳增长特性。
14、如权利要求10所述的***,其特征在于,所述与互联网新词相关的服务资源通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
15、如权利要求10所述的***,其特征在于,所述用于展现互联网新词的单元采用用户端应用程序或者应用程序插件展现互联网新词;或者,采用网站页面方式展现互联网新词。
16、如权利要求10所述的***,其特征在于,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
17、如权利要求10所述的***,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
18、如权利要求10所述的***,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
19、一种互联网信息整合发布的装置,其特征在于,包括:
新词信息数据库,用于存储互联网新词、针对互联网新词自身属性的描述信息、与互联网新词相关的服务资源信息,以及三者之间的映射关系;
接口模块,用于展现互联网新词,以及接收用户针对一互联网新词的信息获取请求;
发布模块,用于当收到针对一互联网新词的信息获取请求时,从所述新词信息数据库获取和发布针对该互联网新词自身属性的描述信息,以及相关服务资源或者相关服务资源的链接。
20、如权利要求19所述的装置,其特征在于,所述与互联网新词相关的服务资源通过依据相应新词在各种类型的服务资源集合中进行查询而获得;所述服务资源类型包括搜索服务、桌面产品、新闻、博客、游戏、关系网络、标签、聚合内容、在线词典或者无线增值服务。
21、如权利要求19所述的装置,其特征在于,所述接口模块采用用户端应用程序或者应用程序插件展现互联网新词;或者,采用网站页面方式展现互联网新词。
22、如权利要求19所述的装置,其特征在于,所述针对互联网新词自身属性的描述信息包括新词定义;所述新词定义是通过对网页信息进行挖掘而获取的。
23、如权利要求19所述的装置,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词在一段时间内,在一定维度上出现次数的统计趋势图或者评价参数;所述维度包括网页信息、查询日志、用户输入或者用户新词点击。
24、如权利要求19所述的装置,其特征在于,
所述针对互联网新词自身属性的描述信息包括相应新词针对特定输入法的正确编码字符串;所述正确编码字符串通过汇总、分析用户编码字符串的输入情况而获得。
CNA2008101050657A 2008-04-25 2008-04-25 一种互联网信息整合发布的方法和*** Pending CN101566995A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008101050657A CN101566995A (zh) 2008-04-25 2008-04-25 一种互联网信息整合发布的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008101050657A CN101566995A (zh) 2008-04-25 2008-04-25 一种互联网信息整合发布的方法和***

Publications (1)

Publication Number Publication Date
CN101566995A true CN101566995A (zh) 2009-10-28

Family

ID=41283149

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008101050657A Pending CN101566995A (zh) 2008-04-25 2008-04-25 一种互联网信息整合发布的方法和***

Country Status (1)

Country Link
CN (1) CN101566995A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908061A (zh) * 2010-07-02 2010-12-08 互动在线(北京)科技有限公司 词条同步方法及词条同步装置
CN101984420A (zh) * 2010-09-03 2011-03-09 百度在线网络技术(北京)有限公司 一种基于拆词处理进行图片搜索的方法与设备
CN102779130A (zh) * 2011-05-11 2012-11-14 腾讯科技(深圳)有限公司 一种微博页面皮肤自动更新的方法及装置
CN103116653A (zh) * 2013-03-05 2013-05-22 清华大学 基于属性匹配的服务资源搜索方法及***
CN103164427A (zh) * 2011-12-13 2013-06-19 ***通信集团公司 新闻聚合方法及装置
CN103248551A (zh) * 2012-02-03 2013-08-14 腾讯科技(深圳)有限公司 一种信息呈现方法及***
CN103399890A (zh) * 2013-07-22 2013-11-20 百度在线网络技术(北京)有限公司 在输入法客户端收集字词的方法和设备
CN103902708A (zh) * 2014-03-31 2014-07-02 安徽新华博信息技术股份有限公司 一种数据查询方法
CN103955453A (zh) * 2014-05-23 2014-07-30 清华大学 一种从文档集中自动发现新词的方法及装置
WO2014206186A1 (zh) * 2013-06-28 2014-12-31 百度在线网络技术(北京)有限公司 一种用于生成词条信息的方法和装置
CN107229724A (zh) * 2017-06-05 2017-10-03 成都知道创宇信息技术有限公司 一种基于浏览记录的链接评分方法
CN107544685A (zh) * 2016-06-29 2018-01-05 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN109120500A (zh) * 2017-06-23 2019-01-01 北京搜狗科技发展有限公司 一种信息处理方法及输入法***
CN111580786A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于互联网+的软件工程开发***
CN113093920A (zh) * 2020-01-09 2021-07-09 北京搜狗科技发展有限公司 词条信息展现方法、装置及***
CN116340469A (zh) * 2023-05-29 2023-06-27 之江实验室 一种同义词挖掘方法、装置、存储介质及电子设备

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908061A (zh) * 2010-07-02 2010-12-08 互动在线(北京)科技有限公司 词条同步方法及词条同步装置
CN101984420A (zh) * 2010-09-03 2011-03-09 百度在线网络技术(北京)有限公司 一种基于拆词处理进行图片搜索的方法与设备
CN102779130A (zh) * 2011-05-11 2012-11-14 腾讯科技(深圳)有限公司 一种微博页面皮肤自动更新的方法及装置
CN103164427B (zh) * 2011-12-13 2016-03-02 ***通信集团公司 新闻聚合方法及装置
CN103164427A (zh) * 2011-12-13 2013-06-19 ***通信集团公司 新闻聚合方法及装置
CN103248551A (zh) * 2012-02-03 2013-08-14 腾讯科技(深圳)有限公司 一种信息呈现方法及***
CN103116653B (zh) * 2013-03-05 2016-03-23 清华大学 基于属性匹配的服务资源搜索方法及***
CN103116653A (zh) * 2013-03-05 2013-05-22 清华大学 基于属性匹配的服务资源搜索方法及***
WO2014206186A1 (zh) * 2013-06-28 2014-12-31 百度在线网络技术(北京)有限公司 一种用于生成词条信息的方法和装置
CN103399890B (zh) * 2013-07-22 2016-10-26 百度在线网络技术(北京)有限公司 在输入法客户端收集字词的方法和设备
CN103399890A (zh) * 2013-07-22 2013-11-20 百度在线网络技术(北京)有限公司 在输入法客户端收集字词的方法和设备
CN103902708A (zh) * 2014-03-31 2014-07-02 安徽新华博信息技术股份有限公司 一种数据查询方法
CN103955453A (zh) * 2014-05-23 2014-07-30 清华大学 一种从文档集中自动发现新词的方法及装置
CN107544685A (zh) * 2016-06-29 2018-01-05 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107229724A (zh) * 2017-06-05 2017-10-03 成都知道创宇信息技术有限公司 一种基于浏览记录的链接评分方法
CN107229724B (zh) * 2017-06-05 2020-07-21 成都知道创宇信息技术有限公司 一种基于浏览记录的链接评分方法
CN109120500A (zh) * 2017-06-23 2019-01-01 北京搜狗科技发展有限公司 一种信息处理方法及输入法***
CN113093920A (zh) * 2020-01-09 2021-07-09 北京搜狗科技发展有限公司 词条信息展现方法、装置及***
CN111580786A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于互联网+的软件工程开发***
CN116340469A (zh) * 2023-05-29 2023-06-27 之江实验室 一种同义词挖掘方法、装置、存储介质及电子设备
CN116340469B (zh) * 2023-05-29 2023-08-11 之江实验室 一种同义词挖掘方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN101566995A (zh) 一种互联网信息整合发布的方法和***
CN100568241C (zh) 用于集中内容管理的方法和***
CN101199122B (zh) 使用语言模块扩展通配符
CN102368788B (zh) 信息推送方法与装置
WO2020140360A1 (zh) 基于剪贴板进行信息推送的方法、***及终端设备
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
US10198776B2 (en) System and method for delivering an open profile personalization system through social media based on profile data structures that contain interest nodes or channels
CN102708174B (zh) 一种浏览器中的富媒体信息的展示方法和装置
US8429099B1 (en) Dynamic gazetteers for entity recognition and fact association
JP6224731B2 (ja) 個人的ユーザ経験を改善するためにソーシャル・メディアを豊富にする方法および装置
US20080312910A1 (en) Dictionary word and phrase determination
US20150154303A1 (en) System and method for providing content recommendation service
CN102349087A (zh) 自动提供与捕获的信息例如实时捕获的信息关联的内容
CN106354861A (zh) 电影标签自动标引方法及自动标引***
CN101329674A (zh) 一种提供个性化搜索的***和方法
WO2013170344A1 (en) Method and system relating to sentiment analysis of electronic content
CN101334774A (zh) 一种字符输入的方法和输入法***
CN101887414A (zh) 对包含图像符号的文本消息传达的评价自动打分的服务器
CN104969254A (zh) 内容的个性化概要
CN102779114A (zh) 利用自动规则生成的非结构化数据支持
JP2008529179A (ja) 自然言語によってモバイル情報にアクセスするための方法及び装置
CN102831229A (zh) 适合盲人使用的网页浏览方法
WO2022262487A1 (zh) 一种表单生成方法、装置、设备及介质
CN101354711A (zh) 信息搜索方法、信息搜索装置、信息搜索***
CN103678362A (zh) 搜索方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20091028

RJ01 Rejection of invention patent application after publication