CN105302859A - 一种基于互联网的智能交互*** - Google Patents
一种基于互联网的智能交互*** Download PDFInfo
- Publication number
- CN105302859A CN105302859A CN201510603622.8A CN201510603622A CN105302859A CN 105302859 A CN105302859 A CN 105302859A CN 201510603622 A CN201510603622 A CN 201510603622A CN 105302859 A CN105302859 A CN 105302859A
- Authority
- CN
- China
- Prior art keywords
- word
- user
- information
- phrase
- steps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
一种基于互联网的智能交互***,所述***采用以下步骤对用户信息进行处理:A、对用户发出的信息进行分词;B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;C、对步骤A所述分词后的字、词及词组进行语义标注分析;D、对步骤A所述分词后的字、词及词组进行文本纠错;E、对用户发出的信息进行句法分析;F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;G、对用户发出的信息进行上下文处理;H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;I、根据阈值结果查询预设知识库,返回结果给用户。
Description
技术领域
本发明涉及一种智能交互方法,更具体的说是涉及一种基于互联网的智能问答方法。
背景技术
在传统的智能交互中,智能交互的一般采用模板方式来应对复杂的对话,准确度较低,或者对信息进行各种分词后进行分析,但一般的分词结果种类多,准确度较低。
发明内容
本发明公开了一种基于互联网的智能交互***,包括以下步骤:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
G、对用户发出的信息进行上下文处理;
H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;
I、根据阈值结果查询预设知识库,返回结果给用户。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错;
所述步骤F中的句法分析采用规则和标注方法。
附图说明
图1-本体及实例化、继承的实例
图2-词类管理
图3-同义词,权重校正
具体实施方式
本发明公开了一种基于互联网的智能交互***,包括以下步骤:
A、对用户发出的信息进行分词;
分词是计算机语言学或人工智能领域的常用技术手段,一般采用“最大匹配分词法”或“最大概率法分词”,
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
对于实体,是本体的实例化,
所谓本体,是对概念的一种明确且详细的说明,是对现实世界的一种描述方法。或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达。一般包含:
——具体的本体实例(对象Object)
——本体的属性
——所属的本体类别。
本体实例化后,就可以继承本体的属性,为其后的语义标注分析做好准备;
具体来说,如附图1,对于银行业务有很多基础业务,所有的基础业务就是一种本体,对于某一种具体的本体,比如办理规则,营销活动就是一种对基础业务的继承,其所有的属性就可以继承下来。
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
对于语义标注分析,包括词性标注和词义标注两个部分:
对于词性标注:一般采用隐马尔科夫模型或者基于转换的错误驱动的磁性标注方法;
对于词义标注:一般采用基于互信息的词义排歧方法或基于词典的排歧方法;
对于该步骤,当用户在机器人前端输入一个问题,这个问题会首先进行分词处理,然后根据分词的结果进行匹配,因此词类的建设优劣,与机器人的智能程度紧密相连。对词类的增删和修改都可在【词类管理】中实现。
如图2,【词类管理】标签下有“公用词类”,“专有词类”,其中“公用词类”下为本体类属性对应的词类,“专有词类”下为项目自定义的特有词类。
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
如图3,选择需要挂入的分类右单击,在菜单中选择【新建子分类】,在弹出框内填入类型名称保存完成。
本***中,类别名称旁边标注的“*”“#”分别用来区分词类的重要度及相似度,“*”代表重要,权重较高;“#”代表不相似,相似度很低;“”代表该分类下的词具有拼音纠错功能。子分类自动继承父级分类的“*”“#”“”设定。
本***还会根据用户数据日志来调整权重。例如:“不”字基于统计学不重要,但经过统计分析,“不”字出现及句尾比例较高,其含义完全不同,所以当“不”字出现在句尾时,例如“我能开通彩铃不”调整“不”字权重。
G、对用户发出的信息进行上下文处理;
H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;
此外,本***还可以实现“语义表达式与普通问句的混合运算”,
例如:一个标准问为:“化妆品标识夸大功效、虚假表示,如何查处?”
对应该标准问的语义表达式可分解为:[化妆品|化妆品牌][虚假][标志][惩罚][方法?]
对应该标准问的某一扩展问为:“化妆品标识标注虚假的信息,对于这种行为工商局采取什么方法惩处”
假设知识库内包含上述知识,***对用户给出的信息可以进行混合处理。即判断用户的问题如贴近于标准问可直接回答;如可分解成语义表达式,则依据语义表达式回答;如不能分解成语义表达式而贴近于扩展问,则依据扩展问回答;而非单独采用上述任意一方式,以获得最大阈值。即最吻合用户需求的答案。
I、根据阈值结果查询预设知识库,返回结果给用户。
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
具体来说,经过根据上述方面进行语义标注分析过后,分过的词的语义准确,歧义基本消除。
所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错;
所述步骤E中的句法分析采用规则和标注方法。
Claims (4)
1.一种基于互联网的智能交互***,所述***采用以下步骤对用户信息进行处理:
A、对用户发出的信息进行分词;
B、对步骤A所述分词后的字、词及词组是否属于实体进行识别;
C、对步骤A所述分词后的字、词及词组进行语义标注分析;
D、对步骤A所述分词后的字、词及词组进行文本纠错;
E、对用户发出的信息进行句法分析;
F、对用户发出的信息及步骤A所述分词后的字、词及词组进行权重校正;
G、对用户发出的信息进行上下文处理;
H、根据所述步骤B-G的结果,对用户发出的信息进行相似度计算,得到阈值;
I、根据阈值结果查询预设知识库,返回结果给用户。
2.根据权利要求1所述的一种基于互联网的智能交互***,其特征在于:
所述步骤C中的语义标注分析包括领域、重要度、同类词、同义词、网络用语。
3.根据权利要求1所述的一种基于互联网的智能交互***,其特征在于:
所述步骤D中的文本纠错包括在领域的业务类词及词组进行拼音纠错。
4.根据权利要求1所述的一种基于互联网的智能交互***,其特征在于:
所述步骤E中的句法分析采用规则和标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603622.8A CN105302859B (zh) | 2015-09-21 | 2015-09-21 | 一种基于互联网的智能交互*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510603622.8A CN105302859B (zh) | 2015-09-21 | 2015-09-21 | 一种基于互联网的智能交互*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105302859A true CN105302859A (zh) | 2016-02-03 |
CN105302859B CN105302859B (zh) | 2018-11-30 |
Family
ID=55200131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510603622.8A Active CN105302859B (zh) | 2015-09-21 | 2015-09-21 | 一种基于互联网的智能交互*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105302859B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485328A (zh) * | 2016-10-31 | 2017-03-08 | 上海智臻智能网络科技股份有限公司 | 信息处理***及方法 |
CN106599163A (zh) * | 2016-12-08 | 2017-04-26 | 上海云信留客信息科技有限公司 | 一种用于大数据的数据挖掘方法和装置 |
CN108073587A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 一种自动问答方法、装置及电子设备 |
CN110175230A (zh) * | 2019-05-29 | 2019-08-27 | 广州伟宏智能科技有限公司 | 智能机器人交互*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174259A (zh) * | 2007-09-17 | 2008-05-07 | 张琰亮 | 一种智能互动式问答*** |
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答***实现方法 |
CN101510221A (zh) * | 2009-02-17 | 2009-08-19 | 北京大学 | 一种用于信息检索的查询语句分析方法与*** |
CN104657346A (zh) * | 2015-01-15 | 2015-05-27 | 深圳市前海安测信息技术有限公司 | 智能交互***中的问题匹配方法和*** |
US20150261744A1 (en) * | 2014-03-12 | 2015-09-17 | Asuman Suenbuel | Systems and methods for natural language processing |
-
2015
- 2015-09-21 CN CN201510603622.8A patent/CN105302859B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174259A (zh) * | 2007-09-17 | 2008-05-07 | 张琰亮 | 一种智能互动式问答*** |
CN101373532A (zh) * | 2008-07-10 | 2009-02-25 | 昆明理工大学 | 旅游领域faq中文问答***实现方法 |
CN101510221A (zh) * | 2009-02-17 | 2009-08-19 | 北京大学 | 一种用于信息检索的查询语句分析方法与*** |
US20150261744A1 (en) * | 2014-03-12 | 2015-09-17 | Asuman Suenbuel | Systems and methods for natural language processing |
CN104657346A (zh) * | 2015-01-15 | 2015-05-27 | 深圳市前海安测信息技术有限公司 | 智能交互***中的问题匹配方法和*** |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485328A (zh) * | 2016-10-31 | 2017-03-08 | 上海智臻智能网络科技股份有限公司 | 信息处理***及方法 |
CN108073587A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 一种自动问答方法、装置及电子设备 |
CN108073587B (zh) * | 2016-11-09 | 2022-05-27 | 阿里巴巴集团控股有限公司 | 一种自动问答方法、装置及电子设备 |
CN106599163A (zh) * | 2016-12-08 | 2017-04-26 | 上海云信留客信息科技有限公司 | 一种用于大数据的数据挖掘方法和装置 |
CN106599163B (zh) * | 2016-12-08 | 2019-11-22 | 上海云信留客信息科技有限公司 | 一种用于大数据的数据挖掘方法和装置 |
CN110175230A (zh) * | 2019-05-29 | 2019-08-27 | 广州伟宏智能科技有限公司 | 智能机器人交互*** |
Also Published As
Publication number | Publication date |
---|---|
CN105302859B (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112069298B (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
WO2020119075A1 (zh) | 通用文本信息提取方法、装置、计算机设备和存储介质 | |
CN105117388B (zh) | 一种智能机器人交互*** | |
CN110717018A (zh) | 一种基于知识图谱的工业设备故障维修问答*** | |
Hawkins et al. | Criterial features in learner corpora: Theory and illustrations | |
CN110222045B (zh) | 一种数据报表获取方法、装置及计算机设备、存储介质 | |
CN103020230A (zh) | 一种语义模糊匹配方法 | |
CN112052324A (zh) | 智能问答的方法、装置和计算机设备 | |
WO2020233386A1 (zh) | 基于aiml的智能问答方法、装置、计算机设备及存储介质 | |
CN105302859A (zh) | 一种基于互联网的智能交互*** | |
CN111143531A (zh) | 一种问答对构建方法、***、装置及计算机可读存储介质 | |
CN112445894A (zh) | 基于人工智能的商务智能***及其分析方法 | |
CN108536673B (zh) | 新闻事件抽取方法及装置 | |
CN111368540A (zh) | 一种基于语义角色分析的关键词信息抽取方法 | |
CN114579709B (zh) | 一种基于知识图谱的智能问答意图识别方法 | |
CN105183716B (zh) | 一种基于抽象语义的智能交互方法 | |
CN109992651B (zh) | 一种问题目标特征自动识别和抽取方法 | |
CN115098657A (zh) | 自然语言转换数据库查询语句的方法、设备及介质 | |
JP2013190985A (ja) | 知識応答システム、方法およびコンピュータプログラム | |
CN105260178A (zh) | 一种智能云服务应用开发方法及*** | |
CN113792542A (zh) | 一种融合句法分析和语义角色剪枝的意图理解方法 | |
CN113157887A (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN117112767A (zh) | 问答结果生成方法和商业查询大模型训练方法、及装置 | |
CN110188190B (zh) | 对话解析方法、装置、服务器及可读存储介质 | |
Nguyen et al. | A vietnamese question answering system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |