CN107292396B - 一种水电设备报修消息处理方法 - Google Patents
一种水电设备报修消息处理方法 Download PDFInfo
- Publication number
- CN107292396B CN107292396B CN201710693063.3A CN201710693063A CN107292396B CN 107292396 B CN107292396 B CN 107292396B CN 201710693063 A CN201710693063 A CN 201710693063A CN 107292396 B CN107292396 B CN 107292396B
- Authority
- CN
- China
- Prior art keywords
- word
- library
- judgment
- list
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000008439 repair process Effects 0.000 title claims abstract description 16
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000011218 segmentation Effects 0.000 claims abstract description 17
- 238000012216 screening Methods 0.000 claims abstract description 5
- 238000000034 method Methods 0.000 claims description 7
- 238000009434 installation Methods 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000007654 immersion Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种水电设备报修消息处理方法,有如下步骤:①取词:对照着字典库的词条,对输入的消息内容进行分词处理,得到分词表;②取近义:对照字典库的近义词项,对分词表进行扩展,得到近义词表;③词频计数:对照语料库,对近义词表进行词频统计;④筛选:对照判别库的判别文本,将近义词表中的近义词表和判别文本里非共有项删除,得到判别词表;⑤判断:根据判别词表里的词频,对照判别库的判别条件,选取判别库的结果文本并输出。本发明通过取词、取近义、词频计数等操作,能够在很大程度上满足自动化处理消息内容的需求,同时性能消耗较低,基本无需更新设备,而且后期升级优化容易,扩展空间大。
Description
技术领域
本发明涉及一种水电设备报修消息处理方法。
背景技术
随着我校的不断发展壮大,在校生与教职工人数、校园基础设施总数都在快速增加,这些将使得后勤传统的水电设备维修模式遇到了巨大的挑战和压力。目前,我校后勤水电设备报修模式是采用逐级上报的方式反应报修情况,由于中间涉及的人员和环节太多,情况信息上报到后勤部口时耗费和反馈的时间比较长,不能够满足实时交互送一特性,原有的信息交互方式己经很难满足用户的需求,不少学生、教师用户己经提出了这一问题。这也造成师生对后勤报修服务不满、误解和安全隐患等诸多问题。
移动通信技术的快速发展,通讯方式产生了巨大的变化。微信公众平台在通讯方式中的优势逐渐显露,成为人们常用的通讯方式之一。开发微信公众平台是一种极为合理的方式,然而在现有技术中,微信后台的报修消息处理一般都是消息内容在后台由专人查阅后,再由专人处理,人工成本高,而且工作内容枯燥乏味,以至于难以找到合适的专人长期进行此项工作。同时,消息内容属于自然语言,而对于自然语言的处理,现有技术大多采用神经网络的方式进行判别,然而神经网络的性能消耗极高,更新设备以满足其性能需求的成本过高。
发明内容
为解决上述技术问题,本发明提供了一种水电设备报修消息处理方法,该水电设备报修消息处理方法通过取词、取近义、词频计数等操作,能够在很大程度上满足自动化处理消息内容的需求,同时性能消耗较低,基本无需更新设备。
本发明通过以下技术方案得以实现。
本发明提供的一种水电设备报修消息处理方法,有如下步骤:
①取词:对照着字典库的词条,对输入的消息内容进行分词处理,得到分词表;
②取近义:对照字典库的近义词项,对分词表进行扩展,得到近义词表;
③词频计数:对照语料库,对近义词表进行词频统计;
④筛选:对照判别库的判别文本,将近义词表中的近义词表和判别文本里非共有项删除,得到判别词表;
⑤判断:根据判别词表里的词频,对照判别库的判别条件,选取判别库的结果文本并输出。
所述字典库中词条和近义词项一一对应。
所述判别库中判别文本是独立词库,判别条件和结果文本一一对应。
所述步骤①中分词处理,是以从左到右逐字判断的方式,对照字典库的词条,取消息内容中和词条中的共有项为分词表中的项。
所述步骤②中,对分词表进行扩展,是将对应于词条的近义词项的内容直接附加在对应的分词表项中。
所述步骤③中,对近义词表进行词频统计,是统计近义词表中的词在语料库中出现的次数。
所述步骤④中,是针对近义词表逐项判断,如遍历判别文本没有找到相同的当前项内容则将当前项删除。
所述步骤⑤中的判别条件为对应判别文本中词项的词频数值判断条件。
本发明的有益效果在于:通过取词、取近义、词频计数等操作,能够在很大程度上满足自动化处理消息内容的需求,同时性能消耗较低,基本无需更新设备,而且后期升级优化容易,扩展空间大。
具体实施方式
下面进一步描述本发明的技术方案,但要求保护的范围并不局限于所述。
本发明提供的一种水电设备报修消息处理方法,有如下步骤:
①取词:对照着字典库的词条,对输入的消息内容进行分词处理,得到分词表;
②取近义:对照字典库的近义词项,对分词表进行扩展,得到近义词表;
③词频计数:对照语料库,对近义词表进行词频统计;
④筛选:对照判别库的判别文本,将近义词表中的近义词表和判别文本里非共有项删除,得到判别词表;
⑤判断:根据判别词表里的词频,对照判别库的判别条件,选取判别库的结果文本并输出。
所述字典库中词条和近义词项一一对应。
所述判别库中判别文本是独立词库,判别条件和结果文本一一对应。
所述步骤①中分词处理,是以从左到右逐字判断的方式,对照字典库的词条,取消息内容中和词条中的共有项为分词表中的项。
所述步骤②中,对分词表进行扩展,是将对应于词条的近义词项的内容直接附加在对应的分词表项中。
所述步骤③中,对近义词表进行词频统计,是统计近义词表中的词在语料库中出现的次数。
所述步骤④中,是针对近义词表逐项判断,如遍历判别文本没有找到相同的当前项内容则将当前项删除。
所述步骤⑤中的判别条件为对应判别文本中词项的词频数值判断条件。
实施例1
假定输入的消息内容为“图书馆三楼渗水”。
①取词:对照着字典库的词条(包括“图书馆”、“三楼”、“渗水”),对输入的消息内容进行分词处理,得到分词表(“图书馆”、“三楼”、“渗水”);
②取近义:对照字典库的近义词项(“图书馆”→“图书室、借阅室”、“三楼”→“三层”、“渗水”→“漏水、浸水”),对分词表进行扩展,得到近义词表(“图书馆、图书室、借阅室、三楼、三层、渗水、漏水、浸水”);
③词频计数:对照语料库,对近义词表进行词频统计(“图书馆10、图书室12、借阅室5、三楼20、三层13、渗水7、漏水23、浸水11”);
④筛选:对照判别库的判别文本(“图书馆、借阅室、三楼、三层、漏水”),将近义词表中的近义词表和判别文本里非共有项(“图书室、渗水、浸水”)删除,得到判别词表(“图书馆10、借阅室5、三楼20、三层13、漏水23”);
⑤判断:根据判别词表里的词频,对照判别库的判别条件(“图书馆”词频>“教学楼”词频、“漏水”词频>5、“三楼”词频>“三层”词频>10),选取判别库的结果文本(“图书馆三楼有漏水现象,请负责图书馆的水电师傅尽快处理”)并输出。
从实施例1可以看出,本发明的技术方案,相对于利用神经网络的判别方式而言,可以大幅提高性能,主要处理均在于查询、对比和统计,计算量小,并且判别库中的判别条件和结果文本可以不断的进一步优化,每一次优化也都无需像神经网络建模那样耗费大量计算资源,且可以根据业务模式需求的转变而及时转变,结果文本在后期优化升级的过程中也可以转变为代码文本由下一级模块执行,实现更高自动化。
Claims (6)
1.一种水电设备报修消息处理方法,其特征在于:有如下步骤:
①取词:对照着字典库的词条,对输入的消息内容进行分词处理,得到分词表;
②取近义:对照字典库的近义词项,对分词表进行扩展,得到近义词表;
③词频计数:对照语料库,对近义词表进行词频统计;
④筛选:对照判别库的判别文本,将近义词表中的近义词表和判别文本里非共有项删除,得到判别词表;
⑤判断:根据判别词表里的词频,对照判别库的判别条件,选取判别库的结果文本并输出;
所述判别库中判别文本是独立词库,判别条件和结果文本一一对应;
所述步骤④中,是针对近义词表逐项判断,如遍历判别文本没有找到相同的当前项内容则将当前项删除。
2.如权利要求1所述的水电设备报修消息处理方法,其特征在于:所述字典库中词条和近义词项一一对应。
3.如权利要求1所述的水电设备报修消息处理方法,其特征在于:所述步骤①中分词处理,是以从左到右逐字判断的方式,对照字典库的词条,取消息内容中和词条中的共有项为分词表中的项。
4.如权利要求1所述的水电设备报修消息处理方法,其特征在于:所述步骤②中,对分词表进行扩展,是将对应于词条的近义词项的内容直接附加在对应的分词表项中。
5.如权利要求1所述的水电设备报修消息处理方法,其特征在于:所述步骤③中,对近义词表进行词频统计,是统计近义词表中的词在语料库中出现的次数。
6.如权利要求1所述的水电设备报修消息处理方法,其特征在于:所述步骤⑤中的判别条件为对应判别文本中词项的词频数值判断条件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710693063.3A CN107292396B (zh) | 2017-08-14 | 2017-08-14 | 一种水电设备报修消息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710693063.3A CN107292396B (zh) | 2017-08-14 | 2017-08-14 | 一种水电设备报修消息处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107292396A CN107292396A (zh) | 2017-10-24 |
CN107292396B true CN107292396B (zh) | 2020-05-05 |
Family
ID=60106176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710693063.3A Expired - Fee Related CN107292396B (zh) | 2017-08-14 | 2017-08-14 | 一种水电设备报修消息处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107292396B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003012679A1 (en) * | 2001-07-26 | 2003-02-13 | International Business Machines Corporation | Data processing method, data processing system, and program |
CN1936893A (zh) * | 2006-06-02 | 2007-03-28 | 北京搜狗科技发展有限公司 | 基于互联网信息的输入法词频库的生成方法和*** |
CN102063452A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和*** |
CN102243649A (zh) * | 2011-06-07 | 2011-11-16 | 上海交通大学 | 本体半自动信息抽取处理装置 |
CN102866782A (zh) * | 2011-07-06 | 2013-01-09 | 哈尔滨工业大学 | 一种提高整句生成效率的输入法和输入法*** |
CN103034657A (zh) * | 2011-09-29 | 2013-04-10 | 日立(中国)研究开发有限公司 | 文档摘要生成方法和装置 |
CN103885924A (zh) * | 2013-11-21 | 2014-06-25 | 北京航空航天大学 | 一种领域自适应的公开课字幕自动生成***及方法 |
CN105425978A (zh) * | 2015-10-26 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 输入数据的处理方法及装置 |
JP2016170750A (ja) * | 2015-03-16 | 2016-09-23 | 富士通株式会社 | データ管理プログラム、情報処理装置およびデータ管理方法 |
CN106126500A (zh) * | 2016-06-22 | 2016-11-16 | 广东亿迅科技有限公司 | 一种关联热词的统计方法 |
CN106202017A (zh) * | 2016-07-12 | 2016-12-07 | 东软集团股份有限公司 | 填写表单的方法及装置 |
CN106294384A (zh) * | 2015-05-19 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 发现新路名的方法及装置 |
CN106844516A (zh) * | 2016-12-28 | 2017-06-13 | 中央民族大学 | 一种热点词的提取方法及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7548863B2 (en) * | 2002-08-06 | 2009-06-16 | Apple Inc. | Adaptive context sensitive analysis |
-
2017
- 2017-08-14 CN CN201710693063.3A patent/CN107292396B/zh not_active Expired - Fee Related
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003012679A1 (en) * | 2001-07-26 | 2003-02-13 | International Business Machines Corporation | Data processing method, data processing system, and program |
CN1936893A (zh) * | 2006-06-02 | 2007-03-28 | 北京搜狗科技发展有限公司 | 基于互联网信息的输入法词频库的生成方法和*** |
CN102063452A (zh) * | 2010-05-31 | 2011-05-18 | 百度在线网络技术(北京)有限公司 | 用于供用户进行文字输入的方法、设备、服务器和*** |
CN102243649A (zh) * | 2011-06-07 | 2011-11-16 | 上海交通大学 | 本体半自动信息抽取处理装置 |
CN102866782A (zh) * | 2011-07-06 | 2013-01-09 | 哈尔滨工业大学 | 一种提高整句生成效率的输入法和输入法*** |
CN103034657A (zh) * | 2011-09-29 | 2013-04-10 | 日立(中国)研究开发有限公司 | 文档摘要生成方法和装置 |
CN103885924A (zh) * | 2013-11-21 | 2014-06-25 | 北京航空航天大学 | 一种领域自适应的公开课字幕自动生成***及方法 |
JP2016170750A (ja) * | 2015-03-16 | 2016-09-23 | 富士通株式会社 | データ管理プログラム、情報処理装置およびデータ管理方法 |
CN106294384A (zh) * | 2015-05-19 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 发现新路名的方法及装置 |
CN105425978A (zh) * | 2015-10-26 | 2016-03-23 | 百度在线网络技术(北京)有限公司 | 输入数据的处理方法及装置 |
CN106126500A (zh) * | 2016-06-22 | 2016-11-16 | 广东亿迅科技有限公司 | 一种关联热词的统计方法 |
CN106202017A (zh) * | 2016-07-12 | 2016-12-07 | 东软集团股份有限公司 | 填写表单的方法及装置 |
CN106844516A (zh) * | 2016-12-28 | 2017-06-13 | 中央民族大学 | 一种热点词的提取方法及*** |
Non-Patent Citations (1)
Title |
---|
"基于多词TF-IDF算法的智能导医***研究";黄雷;《中国优秀硕士学位论文全文数据库医药卫生科技辑》;20160115;正文第3章、第4.1节,图3.4 * |
Also Published As
Publication number | Publication date |
---|---|
CN107292396A (zh) | 2017-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107273350A (zh) | 一种实现智能问答的信息处理方法及其装置 | |
CN102194005B (zh) | 聊天机器人***及自动聊天方法 | |
CN107315766A (zh) | 一种集合智能与人工问答的语音问答方法及其装置 | |
CN107368468A (zh) | 一种运维知识图谱的生成方法及*** | |
CN107908716A (zh) | 基于词向量模型的95598工单文本挖掘方法和装置 | |
CN112527997B (zh) | 一种基于电网领域调度场景知识图谱的智能问答方法及*** | |
CN112419096B (zh) | 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法 | |
CN104572758B (zh) | 一种电力领域专业词汇自动抽取方法及*** | |
CN108763212A (zh) | 一种地址信息提取方法及装置 | |
CN115858758A (zh) | 一种多非结构化数据识别的智慧客服知识图谱*** | |
CN110516057A (zh) | 一种信访问题答复方法及装置 | |
CN114328950A (zh) | 配电网故障处置知识图谱构建、智能辅助决策***及方法 | |
CN114201844A (zh) | 一种基于iec61850标准的水电站全景建模方法 | |
CN115757810A (zh) | 一种知识图谱标准本体构建方法 | |
CN107292396B (zh) | 一种水电设备报修消息处理方法 | |
Jiang et al. | Construction of substation engineering design knowledge graph based on “ontology seven-step method” | |
CN112199488A (zh) | 面向电力客服问答的渐增式知识图谱实体抽取方法和*** | |
CN112417149B (zh) | 一种基于多任务学习的标题生成方法 | |
CN115937881A (zh) | 一种知识图谱构建标准表格内容自动识别方法 | |
Wan et al. | Evaluation model of power operation and maintenance based on text emotion analysis | |
CN114283030A (zh) | 一种基于知识图谱的配电方案推荐方法及装置 | |
CN113312356A (zh) | 基于多模式字符串的设备材料名称匹配方法 | |
CN113140213A (zh) | 一种ai语音功能在配电自动化主站中的应用方法 | |
Han | Research on Big Data Mining Application of Internet of Things Based on Artificial Intelligence Technology | |
Li et al. | Extraction of ontological terminology relations of scheduling regulations based on combination method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200505 |