CN118056220A - 分类装置以及分类方法 - Google Patents
分类装置以及分类方法 Download PDFInfo
- Publication number
- CN118056220A CN118056220A CN202180102844.5A CN202180102844A CN118056220A CN 118056220 A CN118056220 A CN 118056220A CN 202180102844 A CN202180102844 A CN 202180102844A CN 118056220 A CN118056220 A CN 118056220A
- Authority
- CN
- China
- Prior art keywords
- building
- classification
- daily
- terminal
- statement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 31
- 238000010801 machine learning Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 4
- 230000008569 process Effects 0.000 description 39
- 238000007726 management method Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 11
- 238000000926 separation method Methods 0.000 description 8
- 238000010276 construction Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 2
- 239000004519 grease Substances 0.000 description 2
- 235000021190 leftovers Nutrition 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 239000003657 drainage water Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
多个已学习模型(132)~(134)分别是以在被输入了基于日报语句提取出的特征量时输出日报语句的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型。通信接口(115)从终端A(201)接收日报语句。CPU(111)从多个已学习模型(132)~(134)中选择与根据日报语句确定的建筑物的用途对应的对应已学习模型。CPU(111)将特征量输入到对应已学习模型(132)~(134),由此从对应已学习模型输出分类结果。通信接口(115)向终端A(201)发送分类结果。
Description
技术领域
本发明涉及分类装置以及分类方法。
背景技术
在办公室、商业设施、学校或者医院等各种建筑物中,建筑物(楼宇)的管理者在被利用建筑物的利用者进行各种询问(投诉等)的情况下,调查针对询问的原因而对其进行应对。或者,管理者还进行针对设置于建筑物的各种设备的监视***的故障警报等的应对等。这些每天的应对记录被汇总成语句,作为日报语句记录于在建筑物的管理中使用的终端。
存在如下需求:想要对这样存储的日报语句进行分类,生成用于建筑物管理的统计数据,分析统计数据,由此灵活运用于改善建筑物管理。在对日报语句进行分类的情况下,能够假设灵活运用机器学习等进行自动分类。作为进行这样的分类处理的***,例如可举出日本专利第6844072号公报(专利文献1)中记载的建筑物管理***。在该建筑物管理***中,进行针对从利用者对设备的询问的分类处理。
现有技术文献
专利文献
专利文献1:日本专利第6844072号公报
发明内容
发明要解决的课题
但是,在考虑建筑物(楼宇)管理行业的安全性、数据所有者的差异等时,各管理者很难得到大量的日报语句而生成学习模型。因此,训练数据也变少,很难生成高精度的学习模型。其结果是,在实际业务中,很难导入基于机器学习的分类业务。
此外,需要按照每个建筑物对日报语句进行分类,以生成灵活运用于改善各建筑物的建筑物管理的统计数据。由于需要按照每1个建筑物构建学习模型,以通过机器学习对日报语句进行分类,因此,学习模型的构建会花费时间。
本发明正是为了解决上述的课题而完成的,其目的在于,提供一种能够高精度地对与建筑物的管理相关的语句信息进行分类的分类装置以及分类方法。
用于解决课题的手段
本发明的分类装置具有控制部、存储部和通信部。控制部对记录有与建筑物的管理相关的信息的语句信息进行分类。存储部存储多个已学习模型。通信部与用于管理建筑物的终端进行通信。多个已学习模型分别是以在被输入了基于语句信息提取出的特征量时输出语句信息的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型。通信部从终端接收语句信息。控制部从多个已学习模型中选择与根据语句信息确定的建筑物的用途对应的对应已学习模型。控制部将特征量输入到对应已学习模型,由此从对应已学习模型输出分类结果。通信部向终端发送分类结果。
本发明的分类方法是对记录有与建筑物的管理相关的信息的语句信息进行分类的方法。分类方法包含存储多个已学习模型的步骤。多个已学习模型分别是以在被输入了基于语句信息提取出的特征量时输出语句信息的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型。分类方法还包含以下步骤:从用于管理建筑物的终端接收语句信息;根据语句信息确定建筑物的用途;从多个已学习模型中选择与所确定的建筑物的用途对应的对应已学习模型;将特征量输入到对应已学习模型,由此从对应已学习模型输出分类结果;以及向终端发送分类结果。
发明效果
根据本发明,能够高精度地对与建筑物的管理相关的语句信息进行分类。
附图说明
图1是示出分类***的硬件结构的一例的图。
图2是示出语句信息的分类处理的具体例的图。
图3是示出建筑物用途确定处理的具体例的图。
图4是分类处理的流程图。
图5是建筑物用途确定处理的流程图。
图6是用于说明与建筑物用途对应的分类结果的差异的图。
图7是用于说明与建筑物用途对应的分类结果的差异的图。
图8是用于说明学习处理(办公室用)的图。
图9是学习处理(办公室用)的流程图。
具体实施方式
以下,参照附图说明实施方式。在以下的说明中,对相同的部件标注相同标号。它们的名称和功能也相同。因此,不反复进行它们的详细说明。
[分类***1]
图1是示出分类***1的硬件结构的一例的图。分类***1包含分类服务器100和用于管理各建筑物的终端(终端A201、终端B301、终端C401等)。
分类服务器100是对记录有与建筑物的管理相关的信息(针对询问等的对应记录)的语句信息(日报语句)进行分类的服务器。分类服务器100使用API(ApplicationProgramming Interface:应用编程接口),响应于来自终端的分类请求而发送语句信息的分类结果。针对详细情况,使用从图2起的附图容后再述。
终端A201、终端B301、终端C401等能够经由互联网等网络而与分类服务器100连接。
终端A201设置于A楼宇200内。A楼宇200是办公楼(建筑物的用途=办公室)。终端B301设置于B楼宇300内。B楼宇300是商业设施(建筑物的用途=商业设施)。终端C401设置于C楼宇400内。C楼宇400是学校(建筑物的用途=学校)。
在本实施方式中,在各建筑物(楼宇)中,假设进行建筑物设备的管理业务的管理者正在进行管理。管理者应对来自利用建筑物的利用者的各种询问(投诉等)。或者,管理者还应对设置于建筑物的各种设备的监视***的故障警报等。管理者在受理来自利用者的询问或者警报等(以下,称作“询问等”)时,在针对询问等查明原因之后对其进行应对。
这些应对记录(每天的事件)由管理者汇总成语句,作为日报语句记录于终端。日报语句被汇总成每1个案件100~300字左右的语句。
在本例子中,A楼宇200的询问等由A楼宇200的管理者记录于终端A201。B楼宇300的询问等由B楼宇300的管理者记录于终端B301。C楼宇300的询问等由C楼宇400的管理者记录于终端C401。另外,管理者也可以不一定常驻于建筑物,也可以是管理多个建筑物的人。管理建筑物的终端可以设置于远程位置,也可以通过1个终端管理多个建筑物。
分类服务器100具有CPU(Central Processing Unit:中央处理单元)111、ROM(Read Only Memory:只读存储器)112、RAM(Random Access Memory:随机存取存储器)113、存储部114和通信接口115。
CPU 111统一地控制分类服务器100整体。CPU 111将ROM 112中存储的程序展开到RAM 113并执行。ROM 112存储记述有分类服务器100的处理过程的程序。RAM 113为CPU 111执行程序时的工作区域,临时存储程序、执行程序时的数据等。
通信接口115是用于与终端A201、终端B301、终端C401进行通信的接口。存储部114是非易失性存储装置。存储部114例如也可以是HDD(Hard Disk Drive:硬盘驱动器)、SSD(Solid State Drive:固态驱动器)等。
存储部114存储有已学习模型组131、学习用数据集组140和单词词典150。已学习模型组131由多个已学习模型构成。具体而言,已学习模型组131包含办公室用已学习模型132、商业设施用已学习模型133和学校用已学习模型134(以下,也简称作已学习模型132~134)。
在本实施方式中,构成为在具有来自终端的分类请求的情况下,从已学习模型组131(多个已学习模型132~134)中选择与根据日报语句确定的建筑物的用途对应的已学习模型。
具体而言,在建筑物的用途=办公室即A楼宇200时,在具有来自终端A201的分类请求的情况下,选择办公室用已学习模型132。在建筑物的用途=商业设施即B楼宇300时,在具有来自终端B301的分类请求的情况下,选择商业设施用已学习模型133。在建筑物的用途=学校即C楼宇400时,在具有来自终端C401的分类请求的情况下,选择学校用已学习模型134。
另外,建筑物的用途不限于上述用途。例如,作为建筑物的用途,也可以包含“医院”。在该情况下,在具有来自在用途为医院的建筑物中使用的终端的分类请求的情况下,选择医院用的学习模型。针对学习模型的详细情况,使用图2、图8、图9容后再述。
终端A201具有CPU 211、ROM 212、RAM 213、存储部214、通信接口215、输入部220和显示部221。
CPU 211统一地控制利用者终端200整体。CPU 211将ROM 212中存储的程序展开到RAM 213并执行。ROM 212存储记述有利用者终端200的处理过程的程序。RAM 213为CPU 211执行程序时的工作区域,临时存储程序、执行程序时的数据等。
通信接口215是用于与分类服务器100进行通信的接口。存储部214是非易失性存储装置。存储部214例如也可以是HDD、SSD等。
输入部220受理来自用户的输入。输入部220例如是键盘、鼠标、触摸面板。显示部221进行各种信息的显示。显示部221例如是液晶显示器、显示器等。
同样地,终端B301、终端C401也具有CPU、ROM、RAM、存储部、通信接口、输入部和显示部。终端A201、终端B301、终端C401例如是台式计算机、笔记本电脑、平板终端等。
另外,分类服务器100不限于由1个服务器装置构成,也可以由多个服务器装置构成。例如,也可以按照每个地区设置服务器装置,响应来自各地区的分类请求。在该情况下,也可以构成为各地区的服务器装置相互通信,能够共享相互的信息(已学习模型等)。或者,也可以具有管理各地区的服务器的主服务器装置,主服务器装置管理各地区的信息(已学习模型等)。
上述各地区不限于日本境内的各地区,也可以包含日本境外的地区。例如,也可以在日本境外的1个以上的国家或地区设置服务器装置。在该情况下,也可以构成为在日本境内设置服务器装置,与设置于日本境外的服务器装置共享信息(已学习模型等)。此外,也可以在任意国家设置主服务器装置,从设置于各国家的服务器装置参照主服务器装置中存储的信息。
各国家中设置的服务器装置按照管理的每个国家或每个地区具有语言代码。例如,在管理日本境内的建筑物的服务器装置中,设定“日语”作为语言代码。在管理中国境内的建筑物的服务器装置中,设定“汉语”作为语言代码。在管理英语圈国家的建筑物的服务器装置中,设定“英语”作为语言代码。
服务器装置具有与各语言代码对应的语言数据。例如,在具有来自日本境内的终端的访问的情况下,在这些终端上以日语显示信息。在具有来自中国境内的终端的访问的情况下,在这些终端上以中文显示信息。此外,也可以按照每个语言管理询问信息。
[分类处理的过程]
图2是示出语句信息的分类处理的具体例的图。在此,说明终端A201对分类服务器100进行日报语句的分类请求的例子。
日报语句包含建筑物用途(建筑物的用途)、建筑物名称(建筑物的名称)、日报语句数据。作为日报语句数据的内容,通常包含具有询问等时的状况、其原因、其应对。此外,在日报语句中,不一定记录有建筑物用途、建筑物名称,有时也省略它们的记载。
在存储部214中,作为日报语句的一例,记录有建筑物用途“办公室”、建筑物名称“A楼宇”、日报语句数据“租户联系说5F卫生间潮湿。确认结果是大便器堵塞,因此,用皮搋子进行了处置并复原。”。
该日报语句数据是针对来自利用A楼宇(办公楼)200的利用者(例如,入驻A楼宇200的公司的工作人员)的询问(投诉)记录的。A楼宇200的管理人从利用者受理了“5层的卫生间的地板潮湿”这样的投诉。与此相对,管理人在确认了5层的卫生间后,确认原因是卫生间的大便器堵塞。作为其应对,管理人用皮搋子消除大便器的堵塞。
当对这样的按照每个建筑物存储的日报语句进行分类时,能够生成用于建筑物管理的统计数据。分析该统计数据,由此能够掌握在该建筑物中容易发生的询问的趋势等,因此,能够有助于改善楼宇管理(例如,确定容易发生故障的场所,采取其对策等)。
但是,需要对语句进行分类并合计,以根据日报语句生成统计数据。以往,操作者阅读语句,手动地对其进行分类。另一方面,如果能够灵活运用机器学习等AI进行自动分类,则能够实现建筑物管理者的业务的高效化。
在此成为问题的是与用于进行机器学习的日报语句数据的收集和日报语句数据的安全性等相关的方面。需要收集大量的日报语句,以提高机器学习的精度。但是,由于日报语句包含该建筑物的管理信息,因此,需要严格地进行管理,使得其内容不会泄漏到外部。因此,所有者得到不同建筑物的日报语句,其他所有者无法灵活运用该日报语句。
这样,在考虑楼宇管理行业的安全性、数据所有者的差异等时,很难得到大量的日报语句而生成学习模型。因此,训练数据也变少,很难生成高精度的学习模型。其结果是,在实际业务中,很难导入基于机器学习的分类业务。
此外,需要按照每个建筑物对日报语句进行分类,以生成灵活运用于改善各建筑物的建筑物管理的统计数据。由于需要按照每1个建筑物构建学习模型,以通过机器学习对日报语句进行分类,因此,学习模型的构建会花费时间。此外,由于按照建筑物设备的每个管理者使用不同的表现生成日报语句,因此,很难以同一分类对多个楼宇进行合计。
鉴于以上的方面,在本实施方式中,准备了分类服务器100而不是按照每个建筑物进行学习模型的构建和分类处理。然后,分类服务器100统一地进行学习模型的构建和分类处理。并且,按照每个建筑物用途准备了学习模型。
如果建筑物的建筑物用途相同,则建筑物构造、设置的设备、利用者、利用用途等大致相同。因此,如果建筑物用途相同,则日报语句的记录内容也相似。按照每个建筑物用途对建筑物进行编组,由此,即使在各建筑物中日报语句的存储较少的情况下,也能够共享数据而构建高精度的学习模型。由此,能够实现高精度的语句分类。
此时,在分类服务器100中,取得来自各建筑物(各终端)的日报语句,据此进行用于分类的学习处理。分类服务器100从建筑物(楼宇)的业主接受委托,由与业主签订了保密义务合同的管理人员进行管理。
在分类服务器100中,使用各业主拥有的日报语句进行学习处理,但是,以不将这些数据提示给不同的所有者的方式进行数据管理。此外,分类服务器100经由API受理日报语句,返回其分类结果,但是,分类结果本身不包含与其他业主拥有的日报语句相关的秘密信息。通过这样构成,无论公司、团体如何,各建筑物的管理者都能够共享利用1个学习模型。由此,可以在遵守数据的保密义务的同时不按照每个建筑物构建学习模型。
此外,有时按照建筑物的每个管理者,针对同一设备、同一状况,使用不同的表现记录日报。因此,在按照每个建筑物对日报语句进行了分类的情况下,按照每个建筑物,分类结果的表现出现偏差。在如本实施方式那样使用了公共的学习模型的情况下,统一分类结果的表现而不依赖于建筑物。因此,也能够将多个楼宇的日报语句汇总分类,汇总进行统计处理。
这样,在本实施方式中,能够高精度地对与建筑物的管理相关的语句信息(日报语句)进行分类。以下,对本实施方式的结构详细地进行说明。
返回图2的说明,假设终端A201的用户对分类服务器100与上述的日报语句一起进行了日报语句的分类请求。以下,使用流程图,说明分类服务器100的CPU 111执行的分类处理流程。分类处理周期性地启动。图4是分类处理的流程图。以下,将“步骤”也简称作“S”。
在分类处理开始后,分类服务器100的通信接口115从终端A201与日报语句的分类请求一起接收日报语句。在S11中,CPU 111判定通信接口115是否接收到日报语句的分类请求。CPU 111在判定为接收到日报语句的分类请求的情况下(S11中“是”),使处理进入S12。另一方面,CPU 111在未判定为接收到日报语句的分类请求的情况下(S11中“否”),结束分类处理。
在S12中,CPU 111执行建筑物用途确定处理(参照图5)。CPU 111在建筑物用途确定处理中,确定建筑物用途。在本例子中,在日报语句中记录有建筑物用途“办公室”,因此,CPU 111将建筑物用途确定为“办公室”。
在S13中,CPU 111从多个已学习模型132~134中选择与根据日报语句确定的建筑物用途对应的已学习模型。在该例子中,建筑物用途被确定为“办公室”,因此,选择办公室用已学习模型132。
在S14中,CPU 111将从日报语句数据提取出的特征量输入到选择出的已学习模型,由此从该已学习模型输出分类结果。在该例子中,CPU 111将特征量输入到办公室用已学习模型132,得到分类结果。
多个已学习模型132~134分别是以在被输入了基于日报语句提取出的特征量时输出日报语句的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组(学习用数据集组140)实施机器学习处理而得到的模型。
在图2的例子中,针对日报语句数据“租户联系说5F卫生间潮湿。确认结果是大便器堵塞,因此,用皮搋子进行了处置并复原。”,作为分类结果,输出状况“卫生间潮湿”、原因“便器堵塞”、应对“皮搋子处理”。
如上所述,在日报语句数据中包含与“状况”、“原因”、“应对”中的1个以上对应的内容。在该情况下,“状况”是“租户联系说5F卫生间潮湿。”,“原因”是“确认结果是大便器堵塞”,“应对”是“用皮搋子进行了处置并复原。”。
与这些“状况”、“原因”、“应对”分别对应的语句能够用简洁的语言置换。在本实施方式中,作为这样的简洁的语言,用2个单词的组合置换。这2个单词适合由相当于主语的单词和相当于谓语的单词的组合、或者相当于谓语的单词和相当于宾语的单词的组合构成。
例如,在上述例子中,作为“状况”,能够用“厕所”+“潮湿”这2个单词表现,作为“原因”,能够用“便器”+“堵塞”这2个单词表现,作为“应对”,能够用“皮搋子”+“处理”这2个单词表现。
这样,日报语句数据具有建筑物设备的管理特有的语句构造,此外,能够使用在建筑物设备的管理中使用的特征性单词,简洁地表现。如上所述,日报语句数据能够分类成具有“状况”、“原因”、“应对”这样的3个属性的语句。以下,将“状况”、“原因”、“应对”称作“属性代表词”。此外,以下,将用2个单词表示与各属性代表词对应的语句而得到的语句(“厕所潮湿”、“便器堵塞”等)称作“属性内容”。针对特征量的提取以及已学习模型132~134的学习方法,使用图8、图9容后再述。
在S15中,CPU 111使用通信接口115向终端A201发送已生成的分类结果,结束分类处理。作为分类结果,终端A201得到状况“卫生间潮湿”、原因“便器堵塞”、应对“皮搋子处理”。
在图2的例子中,说明了根据日报语句确定建筑物的用途的例子。在以下的图3的例子中,说明无法根据日报语句确定建筑物的用途的例子。
图3是示出建筑物用途确定处理的具体例的图。在本例子中,作为日报语句,未设定有“建筑物用途”。“建筑物名称”被设定成“D楼宇”。“日报语句数据”被设定成“…洗手池的排水较差…。”。
CPU 111在无法根据日报语句确定建筑物的用途的情况下,利用Web服务器500确定建筑物的名称。Web服务器500是能利用检索引擎的服务器。
以下,使用流程图进行说明。图5是建筑物用途确定处理的流程图。建筑物用途确定处理是在图4的S12中执行的处理。
当开始建筑物用途确定处理时,在S21中,CPU 111判定在日报语句中是否具有建筑物用途的记载。CPU 111在判定为在日报语句中具有建筑物用途的记载的情况下(S21中“是”),使处理进入S22。另一方面,CPU 111在未判定为在日报语句中具有建筑物用途的记载的情况下(S21中“否”),使处理进入S23。
在S22中,CPU 111根据日报语句确定建筑物用途,结束建筑物用途确定处理。例如,在图2的例子中,日报语句的“建筑物用途”是“办公室”,因此,将建筑物用途确定为“办公室”。
在S23中,CPU 111判定在日报语句中是否具有建筑物名称的记载。CPU 111在判定为在日报语句中具有建筑物名称的记载的情况下(S23中“是”),使处理进入S24。另一方面,CPU 111在未判定为在日报语句中具有建筑物名称的记载的情况下(S23中“否”),使处理进入S28。
在S24中,CPU 111将建筑物名称设定成检索词,使处理进入S25。在图3的例子中,日报语句的“建筑物名称”被设定成“D楼宇”,因此,设定“D楼宇”作为检索词。这样,CPU 111在无法根据日报语句确定建筑物的用途的情况下,确定建筑物的名称。
分类服务器100的通信接口115能够与Web服务器500进行通信。在S25中,CPU 111使用通信接口115,向Web服务器发送检索词。在本例子中,由于已确定建筑物的名称,因此,向Web服务器500发送该建筑物的名称(D楼宇)。
Web服务器500取得将建筑物名称作为检索词从检索引擎得到的检索结果,发送到分类服务器100。在S26中,CPU 111从Web服务器经由通信接口115取得检索结果。
在S27中,CPU 111根据检索结果确定建筑物用途,结束建筑物用途确定处理。例如,作为检索结果,假设包含“…美食街和购物中心…”这样的语句。在楼宇为商业设施的情况下,“美食街”、“购物中心”是作为特征的关键词。因此,在本实施方式中,决定“商业设施”作为建筑物用途。
上述关键词可以在符合事先准备的关键词的列表时从检索结果中提取,也可以仅提取检索结果中包含的名词作为关键词。在将建筑物名称(“D楼宇”)作为检索词进行了检索的情况下,例如在包含有包含“租户”这样的词语的租赁信息等的情况下,至少能够确定D楼宇是商业设施或者办公楼(不是“医院”或者“学校”)。此外,在D楼宇是办公楼的情况下,有时在检索结果语句中包含有办公室的租赁信息等,该租赁信息包含“办公室”、“办公楼一览”这样的词语。在D楼宇是商业设施的情况下,包含如上所述的“美食街”、“购物中心”、“楼层指引”、“美食指南”等关键词。
例如,也可以通过如上所述进行规则化而得到的规则库确定与关键词(输入)对应的建筑物用途(输出)。或者,也可以以从关键词(输入)输出建筑物用途(输出)的方式,进行使用了已学习模型的估计,该已学习模型是实施机器学习处理而得到的。此外,检索结果不限于语句,也可以是图像。在该情况下,根据从图像信息中提取的信息确定建筑物用途。例如,可以根据从图像信息中提取的文字确定建筑物用途,也可以根据建筑物的外观确定建筑物用途。
在S28中,CPU 111从日报语句数据中提取与建筑物相关的关键词。这样,CPU 111在建筑物的用途和建筑物的名称都无法根据日报语句确定的情况下,提取与建筑物相关的关键词。与建筑物相关的关键词是从日报语句数据中提取的。在S29中,CPU 111根据与建筑物相关的关键词确定建筑物用途,结束建筑物用途确定处理。
与建筑物相关的关键词可以在符合事先准备的与建筑物相关的关键词的列表时从日报语句中提取,也可以仅提取日报语句中包含的名词作为关键词。例如,在日报语句数据中具有“具有来自店铺的联络…”这样的语句的情况下,提取“店铺”这样的关键词。从“店铺”这样的关键词中排除建筑物用途为“医院”、“学校”的可能性。此外,在提取出“医生”、“患者”等关键词的情况下,能够确定建筑物用途为“医院”。在提取出“教师”、“学生”、“毕业”等关键词的情况下,能够确定建筑物用途为“学校”。
在根据与建筑物相关的关键词确定建筑物用途的情况下,例如也可以通过如上所述进行规则化而得到的规则库确定与关于建筑物的关键词(输入)对应的建筑物用途(输出)。或者,也可以以从与建筑物相关的关键词(输入)输出建筑物用途(输出)的方式,进行使用了已学习模型的估计,该已学习模型是实施机器学习处理而得到的。另外,也可以将从日报语句数据中提取出的与建筑物相关的关键词设定成检索词,从Web服务器500取得检索结果,根据检索结果确定建筑物用途。
接着,使用图6、图7,说明与建筑物用途对应的分类结果的差异。在此,说明“排水较差”的原因根据建筑物用途如何不同。图6、图7是用于说明与建筑物用途对应的分类结果的差异的图。
如图6所示,假设在日报语句的日报语句数据中设定有“…厨房的排水较差…”这样的语句。假设使用该日报语句,在B楼宇(商业设施楼宇)300中,使用商业设施用已学习模型133输出分类结果。
此外,假设在日报语句的日报语句数据中设定有“…洗手池的排水较差…”这样的语句。假设使用该日报语句,在A楼宇(办公楼)200中,使用办公室用已学习模型132输出分类结果。
其结果是,假设在B楼宇(商业设施楼宇)300中,作为分类结果,得到状况“排水较差”、“隔油池堵塞”、处置“隔油池清扫”。假设在A楼宇(办公楼)200中,作为分类结果,得到状况“排水较差”、“堵塞”、处置“去除堵塞”。
在此,作为状况,均得到“排水较差”。但是,在商业设施(餐厅)中,作为分类结果,得到作为原因的“隔油池”堵塞、作为处置的“隔油池”清扫。与此相对,在办公室中未得到与“隔油池”相关的分类结果。
隔油池是有义务设置于商用厨房的装置,并且是拦截排水中含有的剩饭、油脂、蔬菜碎渣等而防止其直接流入下水道的装置。在餐厅入驻的商业设施楼宇中,在餐厅的厨房设置隔油池。因此,可以假设隔油池堵塞作为排水较差的原因。另一方面,在没有入驻餐厅的办公楼中,不假设隔油池堵塞作为排水较差的原因。
如使用图6的例子说明的那样,针对状况的一般假设的原因和处置根据建筑物用途而不同。因此,根据建筑物用途准备学习用数据集,生成与建筑物用途对应的已学习模型,由此能够得到更高精度的分类结果。
接着,在图7的例子中,假设在日报语句的日报语句数据中设定有“…洗手池有掉落物…”这样的语句。假设使用该日报语句,在A楼宇(办公楼)200中,使用办公室用已学习模型132输出分类结果。假设在C楼宇(学校)400中,使用学校用已学习模型134输出分类结果。
其结果是,假设在A楼宇(办公楼)200中,作为分类结果,得到状况“洗手池委托拾取掉落物”、“掉落戒指”、处置“U形管的分解应对”。假设在C楼宇(学校)400中,作为分类结果,得到状况“洗手池委托拾取掉落物”,但是,未得到原因和处置的分类结果(“~不能预测~”)。
在此,作为状况,均得到了“洗手池委托拾取掉落物”。在办公楼中,作为分类结果,得到作为原因的掉落“戒指”、作为处置的分解了“U形管”。与此相对,在学校中,未得到分类结果(输出“不能预测”)。
在办公楼中,在具有委托收集洗手池中的掉落物的询问的情况下,假设物品掉落到洗手池的排水槽而无法取出的状况。在该情况下,作为掉落物,假设是进入了排水槽的尺寸的物品。作为典型物品,在办公楼中,假设是女性员工掉落的戒指(或者耳环)。因此,可以假设作为洗手池中的掉落物的原因是掉落了“戒指”。另一方面,在学校中,一般不假设学生掉落戒指。
在图7的例子中,针对状况的一般假设的原因和处置也根据建筑物用途而不同。因此,根据建筑物用途准备学习用数据集,生成与建筑物用途对应的已学习模型,由此能够得到更高精度的分类结果。
[学习处理]
在分类服务器100的学习处理中,学习用数据集组140是将“单词”作为输入而将“属性代表词”和“属性内容”作为输出的数据的组合。
学习处理包含建筑物用途为办公室的情况下的学习处理(办公室用)、建筑物用途为商业设施的情况下的学习处理(商业设施用)和建筑物用途为学校的情况下的学习处理(学校用)。学习用数据集组140包含学习用数据集组(办公室用)142、学习用数据集组(商业设施用)和学习用数据集组(学校用)。
办公室用已学习模型132是使用为办公楼用准备的学习用数据集组(办公室用)142实施学习处理而得到的模型。商业设施用已学习模型133是使用为商业设施用准备的学习用数据集组(商业设施用)实施学习处理而得到的模型。学校用已学习模型134是使用为学校用准备的学习用数据集组(学校用)实施学习处理而得到的模型。
以下,列举办公室用已学习模型132为例,说明学习处理(办公室用)。针对其他模型,学习方法也同样如此。图8是用于说明学习处理(办公室用)的图。
办公室用已学习模型132(估计模型)是以在被输入了具有与日报语句数据中包含的单词关联的意思的单词时输出1个以上的属性代表词以及与属性代表词关联的属性内容的方式,实施使用了训练数据的机器学习处理而得到的模型。
在此,具有与日报语句数据中包含的单词关联的意思的单词是使用单词词典150从历史数据包含的单词中提取出的单词,是在进行建筑物管理时特征性地使用的单词(单词代表词)。
如图8所示,学习用数据集组(办公室用)142包含由单词01、属性代表词01和属性内容01构成的学习用数据集、由单词02、属性代表词02和属性内容02构成的学习用数据集以及由单词03、属性代表词03和属性内容03构成的学习用数据集。
“单词”是使用单词词典150提取出的1个或者多个单词。单词词典150是将代表在日报语句数据中使用的单词的单词代表词和具有与单词代表词关联的意思的单词关联词对应起来的词典。单词代表词包含相当于单词关联词的上位概念的单词,但是,只要具有关联的意思,则也可以不必是相当于上位概念的单词。
例如,与单词代表词“便器”对应的属性关联词是“大便器”、“小便器”等。与单词代表词“下水道”对应的属性关联词是“水龙头”等。与单词代表词“照明”对应的属性关联词是“光源”、“荧光灯”、“灯”、“灯光”等。
使用这样的单词词典150,从日报语句数据中提取单词。例如,在本例子中,假设提取出“卫生间”、“潮湿”、“租户”、“大便器”、“堵塞”、“皮搋子”、“处置”等单词。这样,从日报语句数据中提取出的单词相当于在图4的分类处理的S14中例示的、输入到已学习模型的特征量。
例如,在学习用数据集组(办公室用)142中,单词01是“卫生间”、“潮湿”。与它们对应的属性代表词01是“状况”,与它们对应的属性内容01是“卫生间潮湿”。
即,在使用单词词典150提取出的单词中包含“卫生间”、“潮湿”的情况下,在历史数据中包含具有“状况”这样的属性的语句,以用2个单词表示具有“状况”这样的属性的语句而得到的是“卫生间潮湿”的方式进行学习。
此外,在使用单词词典150提取出的单词中包含“便器”、“堵塞”的情况下,在历史数据中包含具有“原因”这样的属性的语句,以用2个单词表示具有“原因”这样的属性的语句而得到的是“便器堵塞”的方式进行学习。
图9是学习处理(办公室用)的流程图。关于分类处理,当开始学习处理(办公室用)时,在S31中,CPU 111从学习用数据集组(办公室用)142中选择学习用数据集。
在S32中,CPU 111将选择出的学习用数据的单词数据输入到估计模型。在S33中,CPU 111通过基于估计模型31的估计处理输出估计结果。在S34中,CPU 111根据估计结果和与学习用数据对应的正解数据的误差,更新估计模型的参数。
在S35中,CPU 111判定是否根据全部学习用数据集进行了学习。CPU 111在判定为根据全部学习用数据集进行了学习的情况下(S35中“是”),使处理进入S36。另一方面,CPU111在未判定为根据全部学习用数据集进行了学习的情况下(S35中“否”),使处理进入S31。
在S36中,CPU 111存储已学习的估计模型作为办公室用已学习模型132,结束学习处理(办公室用)。
在本实施方式中,终端A201等构成为向分类服务器100发送存储部214中存储的日报语句,从分类服务器100得到分类结果。分类结果是按照包含状况、原因和应对的每个属性项目进行分类的。分类结果例如如下所述灵活运用。终端A201的CPU 211根据多个日报语句,从分类服务器100取得与多个日报语句对应的多个分类结果。CPU 211也可以按照每个属性项目合计(统计)多个分类结果,使终端A201的显示部221显示统计结果。例如,作为状况,具有“卫生间潮湿”、“排水较差”、“委托收集掉落物”、“便器发生故障”等,也可以按照每个状况统计发生数,按照发生数顺序显示。并且,在状况“排水较差”的原因中具有多个原因且其处置中具有多个处置的情况下,也可以使与各状况对应的多个原因和多个处置按照频度顺序显示。此外,这样合计出的合计结果也可以显示于显示部221,并且作为统计数据输出。该数据可以发送给分类服务器100,也可以存储于存储部214,还可以使用打印机打印。由此,能够分析合计结果(统计数据),由此,能够掌握在该建筑物中容易发生的询问的趋势等,因此,能够有助于改善楼宇管理。
[主要结构和效果]
以下,说明上述的实施方式的主要结构和效果。
(1)分类服务器100具有CPU 111、存储部114和通信接口115。CPU 111对记录有与建筑物的管理相关的信息的语句信息(日报语句)进行分类。存储部114存储多个已学习模型132~134。通信接口115与用于管理建筑物的终端(终端A201、终端B301、终端C401等)进行通信。多个已学习模型132~134分别是以在被输入了基于日报语句提取出的特征量时输出日报语句的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组(学习用数据集组140)实施机器学习处理而得到的模型。通信接口115从终端A201接收日报语句。CPU111从多个已学习模型132~134中选择与根据日报语句确定的建筑物的用途对应的对应已学习模型(132~134)。CPU 111将特征量输入到对应已学习模型(132~134),由此从对应已学习模型(132~134)输出分类结果。通信接口115向终端A201发送分类结果。
这样,分类服务器100在根据来自建筑物用途不同的各建筑物的请求选择出与建筑物的建筑物用途对应的适当的已学习模型后,向终端发送日报语句的分类结果。已学习模型是使用按照建筑物的每个用途准备的学习用数据集组140实施机器学习处理而得到的模型。由此,能够高精度地对与建筑物的管理相关的语句信息(日报语句)进行分类。
(2)通信接口115能够与能利用检索引擎的Web服务器500进行通信。CPU 111在无法根据日报语句确定建筑物的用途的情况下,确定建筑物的名称。通信接口115在确定出建筑物的名称的情况下,向Web服务器500发送该建筑物的名称。通信接口115从Web服务器500接收将建筑物的名称作为检索词从检索引擎得到的检索结果。CPU 111根据检索结果,确定建筑物的用途。这样,在建筑物用途不明确的情况下,也能够自动地确定建筑物用途,因此,能够不依赖于人工而高效地进行分类作业。
(3)CPU 111在建筑物的用途和建筑物的名称都无法根据日报语句确定的情况下,提取与建筑物相关的关键词。CPU 111根据与建筑物相关的关键词,确定建筑物的用途。在建筑物用途和建筑物名称不明确的情况下,也能够自动地确定建筑物用途,因此,能够不依赖于人工而高效地进行分类作业。
(4)建筑物的用途包含办公室用、商业设施用、学校用和医院用中的至少2个。由此,能够按照办公室、商业设施、学校、医院等建筑物用途,高精度地对日报语句进行分类。
(5)与建筑物的管理相关的信息包含与来自建筑物的利用者的询问相关的信息。分类结果包含利用者进行了询问时的状况、询问的原因和针对询问的应对。由此,关于与建筑物相关的询问,按照状况、原因、应对进行分类,由此在生成了基于分类结果的统计数据时,能够更细致地分析统计数据。
(6)分类方法是对记录有与建筑物的管理相关的信息的日报语句进行分类的方法。分类方法包含存储多个已学习模型132~134的步骤。多个已学习模型132~134分别是以在被输入了基于日报语句提取出的特征量时输出日报语句的分类结果的方式,使用按照建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型。分类方法还包含以下步骤:从用于管理建筑物的终端接收日报语句;根据日报语句确定建筑物的用途;从多个已学习模型132~134中选择与所确定的建筑物的用途对应的对应已学习模型;将特征量输入到对应已学习模型,由此从对应已学习模型输出分类结果;以及向终端发送分类结果。由此,能够高精度地对与建筑物的管理相关的语句信息(日报语句)进行分类。
应该认为此次公开的实施方式在全部方面都是例示的而不是限制性的。本发明的范围通过权利要求书表示而不通过上述说明表示,意图包含与权利要求书同等的意思和范围内的全部变更。
标号说明
1:分类***;100:分类服务器;111、211:CPU;112、212:ROM;113、213:RAM;114、214:存储部;115、215:通信接口;131:已学习模型组;132:办公室用已学习模型;133:商业设施用已学习模型;134:学校用已学习模型;140:学习用数据集组;142:学习用数据集组(办公室用);150:单词词典;200:A楼宇;220:输入部;221:显示部;300:B楼宇;301:终端B;400:C楼宇;401:终端C;500:Web服务器。
Claims (6)
1.一种分类装置,其中,该分类装置具有:
控制部,其对记录有与建筑物的管理相关的信息的语句信息进行分类;
存储部,其存储多个已学习模型;以及
通信部,其与用于管理所述建筑物的终端进行通信,
所述多个已学习模型分别是以在被输入了基于所述语句信息提取出的特征量时输出所述语句信息的分类结果的方式,使用按照所述建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型,
所述通信部从所述终端接收所述语句信息,
所述控制部从所述多个已学习模型中选择与根据所述语句信息确定的所述建筑物的用途对应的对应已学习模型,
所述控制部将所述特征量输入到所述对应已学习模型,由此从所述对应已学习模型输出所述分类结果,
所述通信部向所述终端发送所述分类结果。
2.根据权利要求1所述的分类装置,其中,
所述通信部能够与能利用检索引擎的服务器装置进行通信,
所述控制部在无法根据所述语句信息确定所述建筑物的用途的情况下,确定所述建筑物的名称,
在确定了所述建筑物的名称的情况下,所述通信部向所述服务器装置发送该建筑物的名称,
所述通信部从所述服务器装置接收将所述建筑物的名称作为检索词而从所述检索引擎得到的检索结果,
所述控制部根据所述检索结果,确定所述建筑物的用途。
3.根据权利要求2所述的分类装置,其中,
所述控制部在所述建筑物的用途和所述建筑物的名称都无法根据所述语句信息确定的情况下,提取与所述建筑物相关的关键词,
所述控制部根据所述关键词,确定所述建筑物的用途。
4.根据权利要求1~3中的任意一项所述的分类装置,其中,
所述建筑物的用途包含办公室用、商业设施用、学校用和医院用中的至少2个。
5.根据权利要求1~4中的任意一项所述的分类装置,其中,
与所述建筑物的管理相关的信息包含与来自所述建筑物的利用者的询问相关的信息,
所述分类结果包含所述利用者进行了询问时的状况、所述询问的原因和针对所述询问的应对。
6.一种分类方法,对记录有与建筑物的管理相关的信息的语句信息进行分类,其中,
所述分类方法包含存储多个已学习模型的步骤,
所述多个已学习模型分别是以在被输入了基于所述语句信息提取出的特征量时输出所述语句信息的分类结果的方式,使用按照所述建筑物的每个用途准备的训练数据组实施机器学习处理而得到的模型,
所述分类方法还包含以下步骤:
从用于管理所述建筑物的终端接收所述语句信息;
根据所述语句信息确定所述建筑物的用途;
从所述多个已学习模型中选择与所确定的所述建筑物的用途对应的对应已学习模型;
将所述特征量输入到所述对应已学习模型,由此从所述对应已学习模型输出所述分类结果;以及
向所述终端发送所述分类结果。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/038575 WO2023067684A1 (ja) | 2021-10-19 | 2021-10-19 | 分類装置および分類方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118056220A true CN118056220A (zh) | 2024-05-17 |
Family
ID=86058914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180102844.5A Pending CN118056220A (zh) | 2021-10-19 | 2021-10-19 | 分类装置以及分类方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7442747B2 (zh) |
CN (1) | CN118056220A (zh) |
WO (1) | WO2023067684A1 (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005067759A (ja) | 2003-08-20 | 2005-03-17 | Hitachi Building Systems Co Ltd | 昇降機の利用状況報告書作成装置 |
JP2008051601A (ja) | 2006-08-23 | 2008-03-06 | Hitachi Building Systems Co Ltd | 設備機器の異常傾向分析装置 |
JP5897446B2 (ja) | 2012-10-11 | 2016-03-30 | 東芝三菱電機産業システム株式会社 | 電子日誌システム |
JP7134915B2 (ja) | 2019-05-14 | 2022-09-12 | 株式会社東芝 | プログラム、クレーム発生予測装置及びクレーム発生予測方法 |
JP7448205B2 (ja) | 2019-09-06 | 2024-03-12 | 国人 小林 | 発明文書分析システム、発明文書分析方法及び発明文書分析処理プログラム |
CN114730443B (zh) | 2019-11-06 | 2023-05-16 | 三菱电机楼宇解决方案株式会社 | 楼宇信息处理装置 |
WO2021090374A1 (ja) | 2019-11-06 | 2021-05-14 | 三菱電機ビルテクノサービス株式会社 | 建物管理装置、建物管理システム及びプログラム |
JP7242585B2 (ja) | 2020-01-31 | 2023-03-20 | 株式会社日立製作所 | リコメンデーションシステムおよびリコメンデーション方法 |
-
2021
- 2021-10-19 WO PCT/JP2021/038575 patent/WO2023067684A1/ja active Application Filing
- 2021-10-19 CN CN202180102844.5A patent/CN118056220A/zh active Pending
- 2021-10-19 JP JP2023554115A patent/JP7442747B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2023067684A1 (ja) | 2023-04-27 |
JPWO2023067684A1 (zh) | 2023-04-27 |
JP7442747B2 (ja) | 2024-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11500818B2 (en) | Method and system for large scale data curation | |
Stvilia et al. | A framework for information quality assessment | |
CN110875095A (zh) | 一种标准化临床大数据中心*** | |
Wan et al. | Improving government services with social media feedback | |
CN114386807A (zh) | 一种公共卫生事件应急***及方法 | |
Dutta et al. | A method for extracting performance metrics using work-order data | |
Hidayatillah et al. | Levels of political participation based on naive bayes classifier | |
Zhang et al. | Big data-assisted urban governance: An intelligent real-time monitoring and early warning system for public opinion in government hotline | |
CN112862581A (zh) | Drg付费模式下医院基于业财融合的精细化成本管理*** | |
JP2015153246A (ja) | 看護管理分析装置及びプログラム | |
CN118056220A (zh) | 分类装置以及分类方法 | |
Linge et al. | MedISys: medical information system | |
Duval et al. | Towards an open learning infrastructure for open educational resources: Abundance as a platform for innovation | |
Murray | An investigation of specifications for migrating to a web portal framework for the dissemination of health information within a public health network | |
JP2019168860A (ja) | データ分析装置及びプログラム | |
Wang et al. | An ontology for Chinese government archives knowledge representation and reasoning | |
Harper et al. | Barriers and facilitators influencing adherence to occupational therapy home assessment recommendations: a mixed methods systematic review protocol | |
JP3644166B2 (ja) | 電子掲示システムおよび電子掲示方法 | |
Morgan | An intelligent decision support system for a health authority: solving information overload | |
Hamfelt et al. | An intelligent interface to legal data bases combining logic programming and hypertext | |
EP1363203A1 (en) | System and method for searching information automatically according to analysed results | |
Bredahl | Bibliometric tools for academia | |
US20140278504A1 (en) | Medical Research Technology Information Consortium | |
Judd et al. | More sense from audit trails: Exploratory sequential data analysis | |
Putro et al. | Prototype Design of Web-Based Drug Inventory Prediction Application Using Multiple Linear Regression Methods at the X District Health Office |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |