CN108604248B - 利用基于人工智能的相关性计算的笔记提供方法及装置 - Google Patents
利用基于人工智能的相关性计算的笔记提供方法及装置 Download PDFInfo
- Publication number
- CN108604248B CN108604248B CN201680081595.5A CN201680081595A CN108604248B CN 108604248 B CN108604248 B CN 108604248B CN 201680081595 A CN201680081595 A CN 201680081595A CN 108604248 B CN108604248 B CN 108604248B
- Authority
- CN
- China
- Prior art keywords
- note
- keyword
- specific
- notes
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
Abstract
公开一种利用以人工智能为基础构建的数据库来计算笔记之间的相关性并且以计算出的相关性为基础支持笔记服务的方法及装置。笔记提供方法,其在和用户终端相关联的笔记提供装置中运行,包括以下步骤:从通过用户终端生成的笔记中提取关键词,对通过利用提取出的关键词的机械学习而计算出的加权值进行反映,从而构建关键词数据库;利用关键词数据库,分别计算出和基准笔记相关的多个对象笔记的相关分数。因此,利用基于人工智能的相关性计算的笔记提供方法和装置反映用户的交互作用,可以更加准确地推荐相关笔记。
Description
技术领域
本发明涉及一种笔记支持技术,更为详细地,涉及一种利用以人工智能为基础构建的数据库对笔记间的相关性进行计算并且以计算的相关性为基础支持笔记服务的方法及装置。
背景技术
像智能手机这样的个人用手机终端超越了单纯的通话功能,还提供备忘录、笔记、日记本、词典、数码相机、网页浏览等多种功能。
其中,作为最基本的功能的备忘录或者笔记功能是即使没有笔或者纸也提供可以将一定要记住的事项储存在手机终端的功能。
但是,现在的笔记功能只可以单纯地罗列文字信息并储存,在提供信息的传输、检索及共享功能方面有限制。
尤其,现在的笔记功能主要问题在于,因为把在正文中包含用户所标记的关键词的笔记作为相关笔记进行提供,即使是实际无相关性的情况,只要包含有相同的关键词就会作为相关笔记显现出来,因此经常给用户带来不便。
发明的内容
用于解决上述问题的本发明的目的是,提供一种利用基于人工智能的相关性计算的笔记提供方法。
用于解决上述问题的本发明的另一个目的是,提供一种利用基于人工智能的相关性计算的笔记提供装置。
根据用于达成上述目的的本发明的一个方面的笔记提供方法,其在和用户终端相关联的笔记提供装置中运行,包括以下步骤:从通过用户终端生成的笔记中提取关键词,对通过利用提取出的关键词的机械学习而计算出的加权值进行反映,从而构建关键词数据库(DB,database);利用关键词DB,分别计算出和基准笔记相关的多个对象笔记的相关分数。
在此,所述计算相关分数的步骤可以包括以下步骤:利用在包含于基准笔记的关键词中特定关键词从多个对象笔记中分别被提取的次数以及在包括基准笔记和多个对象笔记的笔记群组中包含特定关键词的笔记的个数计算出特定关键词的重要度;利用将特定关键词的加权值适用于特定关键词的重要度所得的值来计算相关分数。
在此,利用将针对所述特定关键词的所述加权值适用于所述特定关键词的重要度所得的值来计算出所述相关分数的步骤为,按顺序把包含于基准笔记的关键词决定为特定关键词,按照特定关键词将加权值适用于按照已决定的特定关键词计算出的特定关键词的重要度,将所得的值相加,从而可算出相关分数。
在此,所述方法还可包括如下步骤:根据相关分数的顺序通过用户终端提供与基准笔记相关的多个对象笔记。
在此,所述方法还可包括如下步骤:通过用户终端得到是否分别接受根据相关分数的顺序提供的多个对象笔记的反馈。
在此,所述构建关键词DB的步骤中,可以根据是否分别接受多个对象笔记来更新加权值。
在此,就所述构建关键词DB的步骤而言,从多个对象笔记中接受特定对象笔记时,可提高基准笔记和特定对象笔记中共同的关键词的加权值,从多个对象笔记中拒绝特定对象笔记时,可降低基准笔记和特定对象笔记中共同的关键词的加权值。
在此,所述方法还可包括如下步骤:将更新的加权值决定为提前设定的值以下的关键词加入除外词典,从而使其从关键词中去除。
根据用于达成所述目的的本发明的另一方面的笔记提供方法,其在和笔记提供装置相关联的用户终端运行,包括如下步骤:接收用户的输入从而生成笔记;将生成的笔记传输至笔记提供装置,并且构建以包含于笔记的关键词及关键词的加权值为基础的关键词DB;提取与所述用户的阅览请求相对应的基准笔记;获得由笔记提供装置提供的和基准笔记相关的多个对象笔记,并对基准笔记和多个对象笔记进行显示。
在此,对所述基准笔记和所述多个对象笔记进行显示的步骤中,利用关键词DB,针对和基准笔记相关的多个对象笔记,可以根据算出的相关分数的顺序,分别对多个对象笔记进行显示。
在此,利用在包含于基准笔记的关键词中特定关键词在多个对象笔记中分别被提取的次数以及在包含有基准笔记和多个对象笔记的笔记群组中包含特定关键词的笔记的个数来计算出特定关键词的重要度,利用将特定关键词的加权值适用于特定关键词的重要度所得的值来计算出所述相关分数。
在此,将包含于基准笔记的关键词按顺序决定为特定关键词,在按照已决定的特定关键词所计算出的特定关键词的重要度的基础上按照特定关键词适用加权值,将所得的值相加,从而可算出相关分数。
在此,所述方法还可包括以下步骤:从用户获得是否分别接受根据相关分数的顺序显示的多个对象笔记的反馈。
在此,所述关键词的加权值可以根据是否分别接受多个对象笔记而进行更新。
在此,针对所述关键词的加权值,从多个对象笔记中接受特定对象笔记时,可以以使得基准笔记和特定对象笔记中共同的关键词的加权值提高的形式进行更新,从多个对象笔记中拒绝特定对象笔记时,可以以使得基准笔记和特定对象笔记中共同的关键词的加权值下降的形式进行更新。
根据如上所述的本发明的实施例的利用基于人工智能的相关性计算的笔记提供方法及装置可以反映用户的交互作用(interaction),从而可以更加准确地推荐相关笔记。
另外,根据本发明的实施例,通过学习根据用户的交互作用的关键词的加权值及笔记群组内的关键词的重要度,可以更加准确地提供或者推荐笔记。
另外,根据本发明的实施例,通过更加准确地推荐或提供用户想要的笔记,可以使检索笔记的便利性提升。
附图说明
图1是用于说明根据本发明的实施例的支持笔记提供方法的环境的概念图。
图2是用于说明根据本发明的实施例的关键词及加权值的示例图。
图3是用于说明根据本发明的实施例的关键词-页面索引的示例图。
图4是用于说明根据本发明的实施例的由笔记提供装置运行的笔记提供方法的流程图。
图5是用于说明根据本发明的实施例的由用户终端运行的笔记提供方法的流程图。
图6是用于说明根据本发明的实施例的笔记的关键词分布的相关分数计算的示例图。
图7是用于说明根据本发明的实施例的对笔记进行排序并显示的方法的示例图。
图8是用于说明根据本发明的实施例的笔记提供装置的构成的方框图。
具体实施方式
本发明可以施加多种变更,且可以具备各种实施例,在附图中展示特定实施例并在详细说明中进行详细的说明。但是,应该理解为,本发明不限定于特定的实施形态,而是包括包含在本发明的思想及技术范围内的所有变更、均等物乃至代替物。在说明各个附图时对类似的构成要素使用类似的参照标号。
第一、第二、A、B等术语可以用来说明多种构成要素,但是所述构成要素并不受所述术语的限定。所述术语的目的是用于将一个构成要素与其他构成要素区别开。例如,在不脱离本发明的权利范围的情况下,第一构成要素可以命名为第二构成要素,类似地第二构成要素也可以命名为第一构成要素。及/或者之类的术语是多个相关的记载的项目的组合或包括多个相关的记载的项目中的某一个项目。
言及某一构成要素与其它构成要素“连接”或者“结合”时,应该理解为,虽然可以与其他构成要素直接连接或者结合,但是在中间还可以存在其他构成要素。相反,言及某一构成要素与其他构成要素“直接连接”或者“直接结合”时,应该理解为,在中间不存在其他构成要素。
本申请中使用的术语仅用于说明特定的实施例,不是限定本发明的意图。单数的表达,只要在上下文中没有明确表示不同意思就包括复数的表达。本申请中,“包括”或“具有”等的术语应该理解为,是用来指定记载于说明书的特征、数字、步骤、动作、构成要素、附件或者它们的集合的存在,不提前排除一个或一个以上的其他特征或数字、步骤、操作、构成要素、部件或者它们的集合的存在或附加可能性。
只要没有不同地进行定义,包括技术上的或科学上的术语在内,在此使用的所有术语具有和在本发明所属的技术领域中具有一般知识的技术人员通常所理解的意思相同的意思。和普通词典中定义的意思相同的术语应该解释为,具有和相关技术文脉上所具有的意思一致的意思,只要本申请中没有明确定义,就不解释为以上的或者过于形式上的意思。
以下,参照附图对根据本发明的优选实施例进行详细说明。
图1是用于说明根据本发明的实施例的支持笔记提供方法的环境的概念图。
参照图1,根据本发明的实施例的笔记提供方法在多个用户终端100和笔记提供装置200相互关联的形式下得以运行。
详细地,使用者可以利用用户终端100制作或者生成笔记,通过用户终端100制作或者生成的笔记被传送至笔记提供装置200。在此,用户终端100可以指手机、智能手机、笔记本电脑、平板电脑等,在本发明中无特别的限定。
另外,在本发明中,笔记(NOTE)将比较简略的信息储存为数字形态,可以作为和数字笔记、备忘录、数字备忘录、页面、数字页面等同等的概念被使用。
笔记提供装置200接收从用户终端100制作或者生成的多个笔记,并可以将这些笔记储存于数据库300。但是,笔记提供装置200并不限定于通过如图1所示的和用户终端100相区别的另外的物理装置来实现。
例如,笔记提供装置200可以以设置于各个用户终端100的应用程序的形态被提供。换句话说,用户终端100可以在应用商店(App Store)下载执行与笔记提供装置200相对应的功能的应用程序并进行设置。
使用者通过用户终端100输入信息,从而可以制作或者生成多个笔记。此外,使用者通过利用用户终端100的检索可以找到想要阅读的笔记。
笔记提供装置200通过用户终端100可以提取并提供和使用者想要阅览的笔记相关的多个对象笔记。
详细地,笔记提供装置200可以计算出显示通过用户终端100生成的笔记间的相关性的相关分数。在此,相关分数可以是指能够按顺序显示笔记间的相关性的分数。
尤其,根据本发明的实施例的笔记提供装置200可以以关键词为基础算出相关分数。
例如,笔记之间共享关键词,共享的关键词越多可以判断为相关性就越高。另外,特定关键词只共享于特定笔记之间时可以判断出相关性高。
因此,笔记提供装置200从通过用户终端100生成的笔记中提取关键词,利用提取的关键词可以构建关键词DB。在此,关键词DB可以构建于笔记提供装置200内的数据库300。
尤其,关键词DB可以根据使用者的不同反映关键词的加权值。详细地,笔记提供装置200从用户终端100接收使用者的简单的反馈,从而可以使得关键词的加权值得以更新。例如,笔记提供装置200对笔记间的相关性进行排序并通过用户终端100进行提供的情况,使用者可以对是否接受以顺序化的形式被提供的笔记进行决定和应答。因此,笔记提供装置200接收使用者的所述应答后可以智能地更新关键词的加权值。
图2是用于说明根据本发明的实施例的关键词及加权值的示例图,图3是用于说明根据本发明的实施例的关键词-页面索引的示例图。
参照图2,根据本发明的实施例的笔记提供装置200,对包含于笔记的关键词可以按使用者或者按笔记赋予加权值并进行管理,并可以以关键词DB形态储存及管理加权值。
详细地,可以按使用者来管理关键词的加权值。例如,可以将“电话号码”、“邮件”、“联系方式”等类似的单词设定为关键词,这些加权值可以被设定及更新。参照图2,可以按照“电话号码”、“邮件”、“联系方式”等一样的顺序决定加权值,这根据使用者的行为或者反馈可以实时调整或变更。
参照图3,笔记提供装置200可以按关键词来索引(Indexing)笔记。
图3中“页面UID”表示笔记的识别信息,“项计数(Term Count)”可以表示包含于和特定页面UID相匹配的笔记的特定关键词的个数。
笔记提供装置200可以将按照关键词索引笔记的结果以关键词DB形态进行储存及管理。
例如,“事业计划”关键词可以表示在“页面UID=1”的笔记中存在三次,“同学聚会”的关键词可以表示在“页面UID=18”的笔记中存在六次。
图4是用于说明根据本发明的实施例的由笔记提供装置运行的笔记提供方法的流程图。
参照图4,根据本发明的实施例的笔记提供装置200可以从通过用户终端100生成的笔记中提取关键词S410。详细地,笔记提供装置200通过自然语言处理(NaturalLanguage Processing)可以理解或者处理包含于笔记的文本。即,笔记提供装置200通过对包含于笔记的文本进行形态分析、意义分析等可以对关键词进行提取及理解。
笔记提供装置200对通过利用提取出的关键词的机械学习而计算出的加权值进行反映,从而可构建关键词DB S420。即,如图2所述,笔记提供装置200可对关键词设定加权值,并可以通过关键词DB管理加权值。尤其,笔记提供装置200可以以使用者的关键词使用模式、使用者的反馈等为基础对关键词的加权值进行更新,后续对此进行详细的说明。
笔记提供装置200利用关键词DB,可以分别算出和基准笔记相关的多个对象笔记的相关分数S430。
详细地,笔记提供装置200利用在包含于基准笔记的关键词中特定关键词从多个对象笔记中分别被提取的次数以及在包括基准笔记和多个对象笔记的笔记群组中包含特定关键词的笔记的个数可以计算出特定关键词的重要度。
笔记提供装置200可以利用将特定关键词的加权值适用于特定关键词的重要度所得的值来算出相关分数。例如,笔记提供装置200将包含于基准笔记的关键词按顺序决定为特定关键词,在按已决定的特定关键词算出的特定关键词的重要度的基础上按特定关键词适用加权值,将所得的值相加,从而可算出相关分数。
笔记提供装置200可以根据相关分数的顺序通过用户终端100提供与基准笔记相关的多个对象笔记S440。
笔记提供装置200可以通过用户终端100获得是否分别接受根据相关分数的顺序提供的多个对象笔记的反馈,据此,可以确认是否分别接受根据相关分数的顺序提供的多个对象笔记S450。
尤其,笔记提供装置200根据是否分别接受多个对象笔记可以更新关键词的加权值S460、S470。
例如,笔记提供装置200从多个对象笔记中接受特定对象笔记的情况,可以提高基准笔记和特定对象笔记中共同的关键词的加权值S460。
此外,笔记提供装置200从多个对象笔记中拒绝特定对象笔记的情况,可以降低基准笔记和特定对象笔记中共同的关键词的加权值S470。
更进一步,笔记提供装置200也可以将已更新的加权值决定为预先设定的值以下的关键词加入除外词典,从而将其从关键词里去除。
图5是用于说明根据本发明的实施例的通过用户终端运行的笔记提供方法的流程图。
参照图5,根据本发明的实施例的用户终端100可以和笔记提供装置200连接,从而向使用者提供专业化的笔记推荐服务。在此,用户终端100可以和外部的笔记提供装置200连接并操作,或者可以和设置于用户终端100的应用程序形态的笔记提供装置200连接并操作。
用户终端100可以接收使用者的输入从而生成笔记S510。在此,笔记NOTE将比较简略的信息储存为数字形态,可以作为和数字笔记、备忘录、数字备忘录、页面、数字页面等同等的概念被使用。
用户终端100将生成的笔记传输至笔记提供装置200,能够以包含于笔记的关键词及关键词的加权值为基础构建关键词DB S520。
用户终端100可以提取与用户的阅览请求相对应的基准笔记S530。例如,在通过用户终端100生成并储存的笔记中需要对特定笔记进行阅览的情况,使用者可以在用户终端100输入阅览请求,用户终端100可以提取与阅览请求相对应的笔记。在此,使用者可以通过用户终端100将请求阅览的笔记命名为基准笔记。
用户终端100接收从笔记提供装置200提供的和基准笔记相关的多个对象笔记,从而可以显示基准笔记和多个对象笔记S540。
详细地,用户终端100利用关键词DB,根据针对和基准笔记相关的多个对象笔记分别算出的相关分数的顺序可以对多个对象笔记进行显示。
在此,相关分数可以利用上述的笔记提供装置200计算得出。例如,利用在包含于基准笔记的关键词中特定关键词从多个对象笔记中分别被提取的次数以及在包括基准笔记和多个对象笔记的笔记群组中包含特定关键词的笔记的个数算出特定关键词的重要度,利用将特定关键词的加权值适用于所述特定关键词的重要度所得的值可以计算出相关分数。更为详细地,将包含于基准笔记的关键词按顺序决定为特定关键词,按特定关键词将加权值适用于按已决定的特定关键词算出的特定关键词的重要度,将所得的值相加,从而可以计算出相关分数。
用户终端100可以从使用者获得是否分别接受根据相关分数的顺序显示的多个对象笔记的反馈S550。例如,使用者通过笔记提供装置200认可/接受或者不予认可/拒绝根据相关分数的顺序推荐的笔记,从而可以针对推荐的满意与否反馈意见。
此外,用户终端100可以根据是否分别接受多个对象笔记来更新关键词的加权值S560。
例如,从多个对象笔记中接受特定对象笔记的情况,能够以使得基准笔记和特定对象笔记中共同的关键词的加权值上升的形式进行更新。此外,从多个对象笔记中拒绝特定对象笔记的情况,能够以使得基准笔记和特定对象笔记中共同的关键词的加权值下降的形式进行更新。
图6是用于说明根据本发明的实施例的根据笔记的关键词分布算出相关分数的示例图,图7是用于说明根据本发明的实施例对笔记进行排序并显示的方法的示例图。
首先,参照图6以笔记提供装置200计算出相关分数的方法为例进行说明。
存在由许多笔记构成的笔记群组(group)时,可以算出某一关键词在特定笔记内具有多高的重要度的统计数值,并且可以将该数值命名为“关键词的重要度”。
关键词的重要度和特定关键词在笔记内出现的次数成比例。此外,关键词的重要度和特定关键词在笔记群组中出现的文件的个数成反比。即,特定关键词只在特定笔记中经常出现的情况可以判断为关键词的重要度高。
计算关键词的重要度的方法如下所示。
[公式1]
tf(t,d)=term count
上述的数学式1表示关键词(t)出现于特定笔记(d)的次数。
[公式2]
上述的数学式2表示关键词(t)在笔记的群组(D)(笔记的个数:N)中出现的频度(nt)的倒数(inverse)。
[公式3]
tfidf(t,d,D)=tf(t,d)×idf(t,D)
因此,如所述数学式3所示,关键词的重要度可以通过数学式1与数学式2相乘计算得出。
此外,笔记之间共享关键词,共享的关键词越多可以判断为相关性越高。此外,特定关键词只在特定笔记之间共享时可以判断为相关性高。
因此,根据本发明的实施例的相关分数可以根据以下的数学式4得以算出。
[公式4]
根据所述的数学式4,针对包含于基准笔记(db)的各个关键词(kn),将各个关键词的加权值适用于对象笔记中的关键词的重要度(tfidf),相加所得的值可以计算为相关分数。
换句话说,将包含于基准笔记的关键词按顺序决定为特定关键词,在按照已决定的特定关键词算出的特定关键词的重要度的基础上按特定关键词适用加权值,将所得的值相加,从而可以算出相关分数。
以所述的数学式1至4的使用为例进行如下说明。
参照图6,基准笔记(Note Base)包括四个关键词,且这些关键词的加权值设定为1.0至1.3。此外,基准笔记可以和三个不同的对象笔记(Note1、Note2、Note3,笔记1、笔记2、笔记3)相关联。即,笔记群组可以由四个笔记构成。
首先,在图6中,Note Base和Note 1之间的相关分数可以根据下面的数学式5算出。
[公式5]
参照上述的数学式5,Note Base和Note 1把“this”和“is”作为关键词共享。因此,算出“this”和“is”的重要度(tfidf),将加权值适用于所述重要度,相加所得值可以计算为相关分数因此,可以算出Note Base和Note 1间的相关分数为0。
接下来,在图6中,Note Base和Note 2之间的相关分数可以根据下面的数学式6算出。
[公式6]
参照上述的数学式6,Note Base和Note 2把“this”、“is”及“sample”作为关键词共享。因此,算出“this”、“is”及“sample”的重要度(tfidf),将加权值适用于所述重要度,相加所得的值可以计算为相关分数因此,可以算出NoteBase和Note 2间的相关分数为1.1739。
最后,在图6中,Note Base和Note 3之间的相关分数可以根据下面的数学式7算出。
[公式7]
参照所述数学式7,Note base和Note 3把“this”、“is”及“a”作为关键词共享。因此,计算“this”、“is”及“a”的重要度(tfidf),将加权值适用于所述重要度,相加所得的值可以计算为相关分数因此,可以算出Note Base和Note3间的相关分数为0.7224。
参照所述的数学式5至7,可以知道,和基准笔记相关的三个对象笔记中,Note2的相关分数最高,其次是Note3的相关分数高,Note1的相关分数最低。
因此,如图7所示,可以按照相关分数高的顺序将对象笔记提供至用户终端100。例如,以基准笔记为中心,根据以相关分数为基础的排名(ranking)可以排列对象笔记。
更进一步,根据本发明的实施例,关键词的加权值可以反映使用者的反馈而进行更新。
详细地,如图7所示,使用者从排列好的对象笔记中接受某一个的情况,能够以使得基准笔记和被接受的笔记中共同的关键词的加权值提高的形式进行更新。
例如,接受顺序化的对象笔记中某一个的情况,可以根据下面的数学式8提高关键词的加权值。
[公式8]
w=w+0.001(w≥0.001)
此外,如图7所示,使用者从排列好的对象笔记中拒绝某一个的情况,能够以使得基准笔记和被拒绝的笔记中共同的关键词的加权值下降的形式进行更新。
例如,在拒绝顺序化的对象笔记中某一个的情况,可以根据下面的数学式9来降低关键词的加权值。
[公式9]
w=w-0.001(w≥0.001)
但是,本发明并不只限定于根据数学式8或者9更新加权值,还可以通过多种的运算法则进行更新。
图8是用于说明根据本发明的实施例的笔记提供装置的构成的方框图。
参照图8,根据本发明的实施例的笔记提供装置200可包括:关键词提取部210、加权值设定部220、相关分数计算部230以及数据库300。在此,虽然数据库300作为笔记提供装置200的一部分示出,但是也可以通过另外的物理装置实现或者实现于用户终端100的存储器。
关键词提取部210可以从通过用户终端100生成的笔记中提取关键词。例如,关键词提取部210可以通过自然语言处理(Natural Language Processing)理解或者处理包含于笔记的文本。
加权值设定部220对通过利用提取的关键词的机械学习而算出的加权值进行反映,从而可以在数据库300构建关键词DB。即,如图2所述,加权值设定部220可以给关键词设定加权值从而将加权值作为关键词DB进行管理。尤其,加权值设定部220以使用者的关键词使用模式、使用者的反馈等为基础可以更新关键词的加权值。
相关分数计算部230利用关键词DB可以分别算出和基准笔记相关的多个对象笔记的相关分数。
详细地,相关分数计算部230利用在包含于基准笔记的关键词中特定关键词从多个对象笔记中分别被提取的次数以及在包含基准笔记和多个对象笔记的笔记群组中包括特定关键词的笔记的个数可以算出特定关键词的重要度。
相关分数计算部230利用将特定关键词的加权值适用于特定关键词的重要度所得的值可以计算相关分数。例如,相关分数计算部230将包含于基准笔记的关键词按顺序决定为特定关键词,在按已决定的特定关键词算出的特定关键词的重要度的基础上按特定关键词适用加权值,将所得的值相加,从而计算出相关分数。
相关分数计算部230可以根据相关分数的顺序通过用户终端100提供和基准笔记相关的多个对象笔记。
相关分数计算部230可以通过用户终端100获得是否分别接受按照相关分数的顺序提供的多个对象笔记的反馈,据此,可以确认是否分别接受根据相关分数的顺序提供的多个对象笔记。
尤其,加权值设定部220可以根据分别对多个对象笔记的接受与否来更新关键词的加权值。
例如,加权值设定部220在多个对象笔记中接受特定对象笔记的情况,可以提高基准笔记和特定对象笔记中共同的关键词的加权值。
此外,加权值设定部220在多个对象笔记中拒绝特定对象笔记的情况,可以降低基准笔记和特定对象笔记中共同的关键词的加权值。
更进一步地,加权值设定部220也可以将已更新的加权值决定为预先设定的值以下的关键词加入除外词典,从而将其从关键词里去除。
为了方便说明,将根据上述的本发明的实施例的笔记提供装置200的构成罗列为各个构成部并进行了说明,但可以通过将各构成部中至少两个合并成一个构成部或者将一个构成部分成多个构成部来执行功能,这种的各构成部的合并及分离的实施例的情况,只要不脱离本发明的本质,就也属于本发明的权利范围。
此外,根据本发明的实施例的笔记提供装置的操作可以在用电脑可读的记录媒体中作为电脑可读的程序或者代码来实现。电脑可读的记录媒体包括储存有通过电脑***可以读取的数据的所有种类的记录装置。此外,电脑可读的记录媒体分散于通过网络连接的电脑***中,以分散式储存和运行用电脑可进行读取的程序或代码。
根据上述的本发明的实施例的利用基于人工智能的相关性计算的笔记提供方法及装置可以反映使用者的交互作用(interaction),从而可以更加准确地推荐相关的笔记。
此外,根据本发明的实施例,通过对根据使用者的交互作用的关键词的加权值及笔记群组内的关键词的重要度进行学习,可以更加准确地提供或者推荐笔记。
此外,根据本发明的实施例,通过准确地推荐或者提供使用者想要的笔记,可以提升笔记检索的便利性。
以上参照本发明的优选的实施例进行了说明,但是可以理解的是,所属技术领域的熟练的从业者在没有脱离记载于以下的专利权利要求书的本发明的思想及领域的范围内可以对本发明进行多种修改及变更。
Claims (10)
1.一种笔记提供方法,其在和用户终端相关联的笔记提供装置中运行,包括以下步骤:
从通过所述用户终端生成的笔记中提取关键词,对通过利用提取出的关键词的机械学习而计算出的加权值进行反映,从而构建关键词数据库,所述关键词数据库通过向笔记群组中的每个笔记的提取的关键词分配权重来进行存储和管理;以及
利用所述关键词数据库,分别算出和基准笔记相关的多个对象笔记的相关分数,基准笔记和多个对象笔记被包括在笔记群组中;
其中,相关分数的计算包括通过将与特定关键词在笔记中出现次数成正比的关键词的重要度乘以与特定关键词被包含在笔记群组中的笔记的数量成反比的关键词的重要度来计算特定关键词的重要度;
利用将所述特定关键词的所述加权值适用于所述特定关键词的重要度所得的值来计算出所述相关分数的步骤为,
按顺序将包含于基准笔记的关键词决定为特定关键词,按特定关键词将加权值适用于按照已决定的所述特定关键词算出的所述特定关键词的重要度,将所得的值相加,从而计算相关分数。
2.根据权利要求1所述的笔记提供方法,还包括如下步骤:
根据所述相关分数的顺序,通过所述用户终端提供与所述基准笔记相关的所述多个对象笔记。
3.根据权利要求2所述的笔记提供方法,还包括如下步骤:
通过所述用户终端得到是否分别接受根据所述相关分数的顺序所提供的所述多个对象笔记的反馈。
4.根据权利要求3所述的笔记提供方法,其特征在于,
所述构建关键词数据库的步骤中,根据是否分别接受所述多个对象笔记来更新所述加权值。
5.根据权利要求4所述的笔记提供方法,其特征在于,
针对所述构建关键词数据库的步骤,
从所述多个对象笔记中接受特定对象笔记时,提高所述基准笔记和所述特定对象笔记中共同的关键词的加权值;
从所述多个对象笔记中拒绝特定对象笔记时,降低所述基准笔记和所述特定对象笔记中共同的关键词的加权值。
6.根据权利要求4所述的笔记提供方法,还包括如下步骤:
将已更新的加权值决定为预先设定的值以下的关键词加入除外词典,从而将其从关键词里去除。
7.一种笔记提供方法,其在和笔记提供装置相关联的用户终端运行,包括如下步骤:
接收用户的输入从而生成笔记;
将生成的笔记传输至笔记提供装置,构建以包含于笔记的关键词及所述关键词的加权值为基础的关键词数据库;
提取与所述用户的阅览请求相对应的基准笔记;以及
接受由笔记提供装置提供的与基准笔记相关的多个对象笔记,并对基准笔记和多个对象笔记进行显示;
其中,相关分数的计算包括通过将与特定关键词在笔记中出现次数成正比的关键词的重要度乘以与特定关键词被包含在笔记群组中的笔记的数量成反比的关键词的重要度来计算特定关键词的重要度;
对所述基准笔记和所述多个对象笔记进行显示的步骤为:
利用关键词数据库,按照针对和基准笔记相关的多个对象笔记分别算出的相关分数的顺序对所述多个对象笔记进行显示;
按顺序把包含于基准笔记的关键词决定为特定关键词,按特定关键词将加权值适用于按照已决定的所述特定关键词算出的所述特定关键词的重要度,将所得的值相加,从而算出相关分数。
8.根据权利要求7所述的笔记提供方法,其还包括如下步骤:
从所述用户获得是否分别接受根据所述相关分数的顺序所显示的所述多个对象笔记的反馈。
9.根据权利要求8所述的笔记提供方法,其特征在于,
所述关键词的加权值根据是否分别接受多个对象笔记而进行更新。
10.根据权利要求9所述的笔记提供方法,其特征在于,
针对所述关键词的加权值,
从所述多个对象笔记中接受特定对象笔记时,以使得所述基准笔记和所述特定对象笔记中共同的关键词的加权值提高的形式进行更新;
从所述多个对象笔记中拒绝特定对象笔记时,以使得所述基准笔记和所述特定对象笔记中共同的关键词的加权值下降的形式进行更新。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150187837A KR101694727B1 (ko) | 2015-12-28 | 2015-12-28 | 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치 |
KR10-2015-0187837 | 2015-12-28 | ||
PCT/KR2016/012474 WO2017115994A1 (ko) | 2015-12-28 | 2016-11-01 | 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108604248A CN108604248A (zh) | 2018-09-28 |
CN108604248B true CN108604248B (zh) | 2022-05-27 |
Family
ID=57811844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680081595.5A Active CN108604248B (zh) | 2015-12-28 | 2016-11-01 | 利用基于人工智能的相关性计算的笔记提供方法及装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10896291B2 (zh) |
JP (1) | JP6648283B2 (zh) |
KR (1) | KR101694727B1 (zh) |
CN (1) | CN108604248B (zh) |
WO (1) | WO2017115994A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315735B (zh) * | 2017-05-17 | 2021-02-12 | 网易(杭州)网络有限公司 | 用于笔记整理的方法及设备 |
US10628632B2 (en) * | 2018-04-11 | 2020-04-21 | Accenture Global Solutions Limited | Generating a structured document based on a machine readable document and artificial intelligence-generated annotations |
US20200110996A1 (en) * | 2018-10-05 | 2020-04-09 | International Business Machines Corporation | Machine learning of keywords |
KR20210099564A (ko) * | 2018-12-31 | 2021-08-12 | 인텔 코포레이션 | 인공 지능을 이용한 보안 시스템 |
KR102371744B1 (ko) * | 2021-11-25 | 2022-03-07 | 이상훈 | 인공지능 모델에 기반하여 건설 현장에서의 제한 요인을 예측하는 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101553816A (zh) * | 2006-11-20 | 2009-10-07 | 株式会社爱可信 | 信息显示装置、信息显示程序以及信息显示*** |
KR20100084690A (ko) * | 2007-11-14 | 2010-07-27 | 콸콤 인코포레이티드 | 모바일 환경에서 타깃된 콘텐츠 메시지들의 사용자 상호연관의 학습 및 예측을 위한 키워드 벡터들 및 연관된 메트릭들을 사용하는 방법 및 시스템 |
JP2010170225A (ja) * | 2009-01-20 | 2010-08-05 | Nec Corp | 情報通信システム、情報収集推薦装置、情報推薦方法および制御プログラム |
CN102722558A (zh) * | 2012-05-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 一种为用户推荐提问的方法和装置 |
CN104143005A (zh) * | 2014-08-04 | 2014-11-12 | 五八同城信息技术有限公司 | 一种相关搜索***及方法 |
CN104836720A (zh) * | 2014-02-12 | 2015-08-12 | 北京三星通信技术研究有限公司 | 交互式通信中进行信息推荐的方法及装置 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129472A (ja) * | 1989-07-31 | 1991-06-03 | Ricoh Co Ltd | 文書検索装置における処理方法 |
US6141010A (en) * | 1998-07-17 | 2000-10-31 | B. E. Technology, Llc | Computer interface method and apparatus with targeted advertising |
US20030204496A1 (en) * | 2002-04-29 | 2003-10-30 | X-Mine, Inc. | Inter-term relevance analysis for large libraries |
US8874504B2 (en) * | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
TW200729003A (en) * | 2006-01-25 | 2007-08-01 | Bridgewell Inc | Conceptual keyword function generation method, adjustment method, system, search engine, and calculation method for keyword related value |
US8209320B2 (en) * | 2006-06-09 | 2012-06-26 | Ebay Inc. | System and method for keyword extraction |
US8001105B2 (en) * | 2006-06-09 | 2011-08-16 | Ebay Inc. | System and method for keyword extraction and contextual advertisement generation |
JP2008059099A (ja) | 2006-08-29 | 2008-03-13 | Access Co Ltd | 情報表示装置、情報表示プログラム、および情報表示システム |
US10007895B2 (en) * | 2007-01-30 | 2018-06-26 | Jonathan Brian Vanasco | System and method for indexing, correlating, managing, referencing and syndicating identities and relationships across systems |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
US8949377B2 (en) * | 2008-05-21 | 2015-02-03 | The Delfin Project, Inc. | Management system for a conversational system |
JP5331023B2 (ja) * | 2010-02-12 | 2013-10-30 | 日本電信電話株式会社 | 重要語抽出装置、重要語抽出方法及び重要語抽出プログラム |
KR101120641B1 (ko) | 2010-06-10 | 2012-03-16 | 주식회사 다음커뮤니케이션 | 검색 서비스 제공 장치 및 검색 서비스 제공 방법 |
KR20120014796A (ko) | 2010-08-10 | 2012-02-20 | 에스케이 텔레콤주식회사 | 노트기능 관리 서비스 시스템 및 방법 |
JP6039287B2 (ja) * | 2011-08-01 | 2016-12-07 | ネイバー コーポレーションNAVER Corporation | ブログを推薦するシステム及び方法 |
US11100523B2 (en) * | 2012-02-08 | 2021-08-24 | Gatsby Technologies, LLC | Determining relationship values |
US9348802B2 (en) * | 2012-03-19 | 2016-05-24 | Litéra Corporation | System and method for synchronizing bi-directional document management |
CN103377232B (zh) * | 2012-04-25 | 2016-12-07 | 阿里巴巴集团控股有限公司 | 标题关键词推荐方法及*** |
US8522130B1 (en) * | 2012-07-12 | 2013-08-27 | Chegg, Inc. | Creating notes in a multilayered HTML document |
US8787941B2 (en) * | 2012-07-31 | 2014-07-22 | Longsand Limited | Prohibiting electronic device usage based on geographical location |
US10133812B2 (en) * | 2012-12-05 | 2018-11-20 | Grapevine6 Inc. | System and method for finding and prioritizing content based on user specific interest profiles |
JP6010796B2 (ja) * | 2013-03-19 | 2016-10-19 | 株式会社Pfu | 情報処理装置、情報処理システム、及びプログラム |
KR102027899B1 (ko) * | 2013-05-21 | 2019-10-02 | 삼성전자 주식회사 | 메신저를 이용한 정보 제공 방법 및 장치 |
US20140372216A1 (en) * | 2013-06-13 | 2014-12-18 | Microsoft Corporation | Contextual mobile application advertisements |
US10191999B2 (en) * | 2014-04-30 | 2019-01-29 | Microsoft Technology Licensing, Llc | Transferring information across language understanding model domains |
-
2015
- 2015-12-28 KR KR1020150187837A patent/KR101694727B1/ko active IP Right Grant
-
2016
- 2016-11-01 JP JP2018534707A patent/JP6648283B2/ja active Active
- 2016-11-01 US US16/066,576 patent/US10896291B2/en active Active
- 2016-11-01 CN CN201680081595.5A patent/CN108604248B/zh active Active
- 2016-11-01 WO PCT/KR2016/012474 patent/WO2017115994A1/ko active Application Filing
-
2020
- 2020-12-29 US US17/136,216 patent/US20210117834A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101553816A (zh) * | 2006-11-20 | 2009-10-07 | 株式会社爱可信 | 信息显示装置、信息显示程序以及信息显示*** |
KR20100084690A (ko) * | 2007-11-14 | 2010-07-27 | 콸콤 인코포레이티드 | 모바일 환경에서 타깃된 콘텐츠 메시지들의 사용자 상호연관의 학습 및 예측을 위한 키워드 벡터들 및 연관된 메트릭들을 사용하는 방법 및 시스템 |
JP2010170225A (ja) * | 2009-01-20 | 2010-08-05 | Nec Corp | 情報通信システム、情報収集推薦装置、情報推薦方法および制御プログラム |
CN102722558A (zh) * | 2012-05-29 | 2012-10-10 | 百度在线网络技术(北京)有限公司 | 一种为用户推荐提问的方法和装置 |
CN104836720A (zh) * | 2014-02-12 | 2015-08-12 | 北京三星通信技术研究有限公司 | 交互式通信中进行信息推荐的方法及装置 |
CN104143005A (zh) * | 2014-08-04 | 2014-11-12 | 五八同城信息技术有限公司 | 一种相关搜索***及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20210117834A1 (en) | 2021-04-22 |
CN108604248A (zh) | 2018-09-28 |
KR101694727B1 (ko) | 2017-01-10 |
JP2019500704A (ja) | 2019-01-10 |
WO2017115994A1 (ko) | 2017-07-06 |
JP6648283B2 (ja) | 2020-02-14 |
US20190012310A1 (en) | 2019-01-10 |
US10896291B2 (en) | 2021-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108604248B (zh) | 利用基于人工智能的相关性计算的笔记提供方法及装置 | |
CN108763502B (zh) | 信息推荐方法和*** | |
CN108885624B (zh) | 信息推荐***及方法 | |
CN102073699A (zh) | 用于基于用户行为来改善搜索结果的方法、装置和设备 | |
CN110503506B (zh) | 基于评分数据的物品推荐方法、装置及介质 | |
CN110309405B (zh) | 一种项目推荐方法、装置及存储介质 | |
CN103562847A (zh) | 功能提示***、终端装置、服务装置、程序和功能提示方法 | |
WO2020019562A1 (zh) | 搜索排序方法、装置、电子设备和存储介质 | |
CN108153909B (zh) | 关键词投放拓词方法、装置及电子设备、存储介质 | |
EP2884451A1 (en) | Product and content association | |
CN112818111B (zh) | 文档推荐方法、装置、电子设备和介质 | |
CN111738785A (zh) | 选品方法、***及存储介质 | |
CN105528338A (zh) | 智能预测的输入方法和*** | |
CN113849748A (zh) | 信息展示方法、装置、电子设备及可读存储介质 | |
CN114330329A (zh) | 一种业务内容搜索方法、装置、电子设备及存储介质 | |
JP5048852B2 (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
CN114357325A (zh) | 内容搜索方法、装置、设备及介质 | |
JP6433270B2 (ja) | コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法 | |
CN111859154B (zh) | 一种应用推荐方法及装置 | |
CN110263137B (zh) | 主题关键词的提取方法和装置、电子设备 | |
CN111753199B (zh) | 用户画像构建方法及设备、电子设备和介质 | |
JP2022106948A (ja) | 情報表示方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN114445179A (zh) | 业务推荐方法、装置、电子设备和计算机可读介质 | |
CN109213937B (zh) | 智能搜索方法及装置 | |
CN111310016B (zh) | 标签挖掘方法、装置、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |