WO2023079971A1 - 演算装置、作業計画の作成方法、演算システム - Google Patents

演算装置、作業計画の作成方法、演算システム Download PDF

Info

Publication number
WO2023079971A1
WO2023079971A1 PCT/JP2022/039107 JP2022039107W WO2023079971A1 WO 2023079971 A1 WO2023079971 A1 WO 2023079971A1 JP 2022039107 W JP2022039107 W JP 2022039107W WO 2023079971 A1 WO2023079971 A1 WO 2023079971A1
Authority
WO
WIPO (PCT)
Prior art keywords
work
evaluation
required time
plan
strict
Prior art date
Application number
PCT/JP2022/039107
Other languages
English (en)
French (fr)
Inventor
一成 末光
契 宇都木
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Publication of WO2023079971A1 publication Critical patent/WO2023079971A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations

Definitions

  • the present invention relates to an arithmetic device, a work plan creation method, and an arithmetic system.
  • Patent Document 1 discloses a machine learning device that learns a control command for a machine by machine learning, and a machine learning device that performs the machine learning and outputs the control command, Disclosed is a machine learning device comprising: a simulator that executes a simulation of a work motion; and a first determiner that determines the control command based on a result of execution of the simulation by the simulator. .
  • a computing device is a computing device that creates a work plan for a predetermined work in an environment in which information about a changing environment can be expressed as environmental parameters, the time required for the predetermined work being: an evaluation scenario generating unit that generates an evaluation scenario based on the latest environmental parameters, and an evaluation scenario generating unit that generates an evaluation scenario based on the latest environmental parameters; a surrogate model generation unit that creates a surrogate model for calculating the required time; and a temporary work plan that is the work plan that is suitable for any of the plurality of environmental parameters by calculating the required time using the surrogate model.
  • a method of creating a work plan according to a second aspect of the present invention is a method of creating a work plan, in which a computing device creates a work plan for a predetermined work for an environment in which information about the changing environment can be expressed as an environment parameter.
  • a rigorous evaluation process for calculating the time required for the predetermined work
  • an evaluation scenario generation process for generating an evaluation scenario based on the latest environmental parameters
  • a proxy model generation process for creating a proxy model for performing calculations related to the predetermined work more easily than the strict evaluation process
  • a strict required time which is the time calculated by the strict evaluation process and is the required time required for the predetermined work in the provisional work plan.
  • the proxy required time which is the time calculated using the proxy model and is the required time required for the predetermined work in the provisional work plan, if the difference is greater than or equal to a predetermined threshold, the provisional work plan and the and a surrogate model update process for updating the surrogate model using exact duration.
  • a computing system is a computing system that creates a work plan for a predetermined work in an environment in which information about a changing environment can be expressed as environmental parameters, wherein the required time for the predetermined work is an evaluation scenario generating unit that generates an evaluation scenario based on the latest environmental parameters, and an evaluation scenario generating unit that generates an evaluation scenario based on the latest environmental parameters; a surrogate model generation unit that creates a surrogate model for performing calculation; and a provisional work plan that is the work plan that is suitable for any of the plurality of environmental parameters by performing calculations related to the predetermined work using the surrogate model.
  • the proxy model is generated using the provisional work plan and the strict required time. and a proxy model updater for updating.
  • the accuracy of simple calculations can be improved.
  • a computing device draws up a work plan under a variable environment. Arithmetic devices can be applied to various applications in which various environments change.
  • FIG. 1 is a table showing an example of an application to which a computing device can be applied.
  • FIG. 1 shows, for each application, what the computing device is instructed to do, the computation results of the computing device, and the changing environmental parameters.
  • Environmental parameters are parameters that affect the application and that can fluctuate over a short period of time.
  • the term "short time” used herein means a time shorter than the time required for the computation by the computation device. Environmental parameters tend to change more as time passes. Therefore, the longer the calculation takes, the greater the fluctuation range of the environmental parameters at the start and end of the calculation.
  • the "calculation result" shown in FIG. 1 can be rephrased as the "work plan" calculated by the arithmetic device.
  • an AGV Automatic Guided Vehicle
  • a list of product names and times at which picking of the products should be completed is input to the computing device. Note that the location of each product in the warehouse is known to the AGV and computing device.
  • the arithmetic unit calculates and outputs which products are to be picked in which order by each AGV.
  • the following environmental parameters can fluctuate in a short period of time.
  • the environmental parameters in the application of "goods picking" are, for example, the picking speed, the number of AGVs, and the speed of the AGVs.
  • the picking speed which is the speed at which AGVs pick up products
  • the number of AGVs that can be operated is not constant due to failures, recharging, and the like.
  • the maximum speed at which the AGV can travel varies depending on the condition of the floor surface and the like.
  • a delivery person delivers a package to a residence.
  • a list of addresses and due times is input to the computing device. Note that the link between the address and the package to be delivered is managed separately.
  • the computing device outputs the order of visits to delivery destinations for each worker.
  • road conditions such as traffic jams and road closures, and the movement speed of workers, which changes depending on the weather, are environmental parameters.
  • FIG. 2 is a configuration diagram of the arithmetic device 1 according to the first embodiment.
  • the arithmetic unit 1 includes a CPU 11 as a central processing unit, a ROM 12 as a read-only storage device, a storage unit 13 as a non-volatile storage device, and a memory 14 as a high-speed readable/writable storage device.
  • the CPU 11 develops a program stored in the ROM 12 in the memory 14 and executes it, thereby performing calculations to be described later.
  • Arithmetic device 1 has functions described later by FPGA (Field Programmable Gate Array), which is a rewritable logic circuit instead of a combination of CPU 11, ROM 12, and memory 14, and ASIC (Application Specific Integrated Circuit), which is an application specific integrated circuit. may be realized. Further, the arithmetic device 1 may be realized by a combination of different configurations, for example, a combination of the CPU 11, the ROM 12, the memory 14 and an FPGA instead of the combination of the CPU 11, the ROM 12 and the memory 14.
  • FPGA Field Programmable Gate Array
  • ASIC Application Specific Integrated Circuit
  • the computing device 1 has functions such as a proxy model generation unit 41, a proxy model update unit 42, an evaluation scenario generation unit 43, a plan generation unit 44, a disturbance evaluation unit 45, a strict evaluation unit 51, and a simple evaluation unit. a portion 52; As described above, these functions are realized by the CPU 11 expanding and executing a program stored in the ROM 12 in the memory 14, so in FIG. ing.
  • the storage unit 13 of the computing device 1 stores work instructions 21, environmental parameters 22, an assumed variation range 23, an allowable prediction error 24, learning data 25, proxy model information 26, and a proxy model 27. be.
  • the proxy model 27 is shown in FIG. Details will be described later.
  • the proxy model generation unit 41 generates one or more proxy models 27 .
  • the proxy model update unit 42 updates the proxy model 27 generated by the proxy model generation unit 41 .
  • the evaluation scenario generation unit 43 acquires the environmental parameters 22 at the current time, and generates a plurality of evaluation scenarios that are varied randomly within a predetermined range.
  • the plan generation unit 44 uses the multiple evaluation scenarios generated by the evaluation scenario generation unit 43 and the simple evaluation unit 52 to generate a provisional plan, which is a provisional work plan, and an approximate evaluation value of the provisional plan. Calculate
  • the rigorous evaluation unit 51 uses a rigorous model (not shown) to perform high-accuracy evaluation with a high computational cost.
  • the rigorous evaluation unit 51 is, for example, a simulator, which simulates the picking operation of individual commodities in the picking work, the movement for picking, and the like, and calculates the required work time.
  • the simple evaluation unit 52 uses the proxy model 27 to perform simple evaluation with low computation cost.
  • the proxy model 27 may be realized by machine learning such as a neural network that approximates simulation evaluation, may be a simulation model more abstract than the strict evaluation unit 51, or may be a simple formula.
  • the evaluation by the strict evaluation unit 51 is more accurate than the simple evaluation unit 52.
  • the evaluation by the simple evaluation unit 52 is less precise than the strict evaluation unit 51 .
  • Calculation cost means, for example, the amount of calculation, calculation time, amount of calculation resources required for calculation, and the like. For example, if the exact evaluation unit 51 and the simple evaluation unit 52 use the same computing hardware, the strict evaluation unit 51 takes longer than the simple evaluation unit 52 to complete the evaluation. Also, if the strict evaluation unit 51 and the simple evaluation unit 52 complete the evaluation in the same time, the strict evaluation unit 51 requires more computational resources than the simple evaluation unit 52 .
  • the strict evaluation unit 51 in order for the strict evaluation unit 51 and the simple evaluation unit 52 to complete the evaluation in the same time, the strict evaluation unit 51 must use more arithmetic cores than the simple evaluation unit 52, The unit 51 needs to use a calculation core with a larger amount of calculation per unit time than the simple evaluation unit 52 does.
  • the strict evaluation unit 51 and the simple evaluation unit 52 are efficiently combined and used. Furthermore, in the present embodiment, the low accuracy of the strict evaluation unit 51 is compensated for by appropriately improving and selecting the simple evaluation unit 52 .
  • FIG. 3 is a diagram showing an example of the work instruction 21.
  • the work instruction 21 includes a plurality of combinations of work instruction IDs, products, deadline times, and the number of deliveries.
  • the first record in FIG. 3 instructs to prepare "6" products "A" by "17:00".
  • the work instruction ID is an identifier for identifying an individual work instruction, and does not have to be included in the work instruction 21 .
  • similar instructions may be repeated in place of the number of deliveries. For example, product "A" and deadline time "17:00" may be recorded in 6 consecutive records.
  • FIG. 4 is a diagram showing an example of the environmental parameters 22.
  • the environmental parameters 22 include multiple combinations of detailed parameters and values.
  • the environment parameter 22 stores parameters such as the number of AGVs and picking speed. As described above, the environmental parameters 22 change in a short period of time, so the environmental parameters 22 shown here are only values at certain timings.
  • the computing device 1 may acquire the environmental parameters 22 from another device (not shown), or may acquire individual values constituting the environmental parameters 22 from a sensor (not shown) connected to the computing device 1. good.
  • FIG. 5 is a diagram showing an example of the assumed fluctuation range 23.
  • the assumed variation range 23 describes an assumed variation range for each detailed parameter of the environmental parameter 22 .
  • the fluctuation width of the assumed fluctuation range 23 may be set based on past statistical information of detailed parameters, or may be arbitrarily set by the operator. It should be noted that the value of the assumed variation range 23 is merely a statistical value or an arbitrarily set value. However, in the present embodiment, positive countermeasures against fluctuations of the environmental parameter 22 exceeding the assumed fluctuation range 23 are not taken.
  • the example shown in FIG. 5 indicates that the number of AGVs is ⁇ 2 units, the picking speed is ⁇ 20 pieces/hour, and the like.
  • FIG. 6 is a diagram showing an example of allowable prediction error information G4.
  • the permissible prediction error information G4 defines the permissible range of prediction errors between the strict evaluation section 51 and the simple evaluation section 52 .
  • the operator arbitrarily sets the value of the allowable prediction error information G4.
  • the first record in FIG. 6 states that it is permissible if the time required to complete all the work is within ⁇ 30 minutes. This "required time” can also be called “work time” or "processing time”.
  • the second record in FIG. 6 describes that a margin time of ⁇ 15% before the delivery date is acceptable.
  • FIG. 7 is a diagram showing an example of the learning data 25.
  • the learning data 25 stores data used to generate the proxy model 27 .
  • the learning data 25 may store data in advance, or may be empty, that is, no data may be stored at the start of a proxy model generation process, which will be described later. Data is added to the learning data 25 by proxy model generation processing and update processing, which will be described later.
  • the learning data 25 includes multiple samples. Each sample includes an input to the strict evaluation unit 51 and an output of the strict evaluation unit 51 .
  • each record of the learning data 25 includes a sample ID that identifies a sample, a data attribute that indicates input/output to/from the strict evaluation unit 51, a data name, and a data value.
  • the information of the records of the learning data 25 having the same sample ID and having the data attribute of "input" are input to the strict evaluation unit 51 at the same timing.
  • a combination of data name and data value in learning data 25 corresponds to a record with work instruction 21 .
  • Different sample IDs indicate different environmental parameter values. Although not shown in FIG. 7, specific values of environmental parameters corresponding to each sample ID are also recorded separately.
  • FIG. 8 is a diagram showing an example of the proxy model information 26.
  • the surrogate model information 26 stores the names and values of internal parameters that are information of the surrogate model 27 generated using the learning data 25 .
  • the proxy model information 26 stores parameter value information for each internal parameter ID that identifies the internal parameter.
  • the proxy model 27 is configured by combining information on the proxy model 27 (not shown) and the proxy model information 26 .
  • the surrogate model 27 is, for example, a neural network, and the combination of information about the configuration of the surrogate model 27 (not shown) and the parameters stored in the surrogate model information 26 enables computation using the surrogate model 27 .
  • the proxy model 27 is a polynomial, and the calculation using the proxy model 27 is possible by combining the polynomial formula (not shown) with the values of the coefficients in the polynomial stored in the proxy model information 26. The above is the description of the information stored in the storage unit 13 .
  • FIG. 9 is a flowchart showing an outline of processing by the arithmetic unit 1.
  • the proxy model generation unit 41 generates the proxy model 27 . This processing is executed in advance before the work instruction 21 is received.
  • the arithmetic unit 1 acquires the work instructions 21, for example, a list of product names and time limits from the outside.
  • the evaluation scenario generator 43 obtains the value of the environmental parameter 22 at the time t, and generates a plurality of virtual environmental parameters (hereinafter referred to as "evaluation scenario”) randomly changed based on this value. ).
  • the draft plan generation unit 44 calculates an optimum work plan (hereinafter referred to as a "provisional work plan") using the proxy model 27, and calculates the average required work plan when the provisional work plan is applied to the evaluation scenario.
  • Time is calculated using the surrogate model 27 .
  • optimum here means that the required time is short on average even for the plurality of environment parameters generated in step S33.
  • the average required time calculated in this step is also called “proxy required time” because it is calculated using the proxy model 27.
  • the strict evaluation unit 51 calculates the average required time when the provisional work plan calculated in step S34 is applied to the evaluation scenario. That is, the strict evaluation unit 51 performs calculations the same number of times as the number of environmental parameters 22 included in the evaluation scenario, calculates each required time, and calculates their average value. Note that the average required time calculated in this step is also called “strict required time” because it is calculated using the strict evaluation unit 51.
  • step S36 the draft plan generation unit 44 determines whether the difference between the average required time of the provisional work plan calculated in step S34 and the average required time of the provisional work plan calculated in step S35 is within a threshold. to judge. In other words, in this step, the draft plan generation unit 44 determines whether or not the difference between the proxy required time and the strict required time is within the threshold.
  • step S37 When the plan generation unit 44 determines that the difference between the two average required times is within the threshold, the process proceeds to step S37, outputs the provisional work plan, and ends the processing of FIG. If the plan generation unit 44 determines that the difference between the two average required times is equal to or greater than the threshold, the process proceeds to step S38.
  • step S38 the proxy model updating unit 42 adds the input to the strict evaluation unit 51 in step S35 and the output of the strict evaluation unit 51 in step S35 to the learning data 25, and further uses this learning data 25 to update the proxy model 27.
  • Updating the proxy model 27 means updating parameter values in the proxy model information 26 .
  • step S34 that is executed after transitioning from step S38, the updated proxy model 27 that is different from the initial step S34 is used. Since the learning data 25 of the updated proxy model 27 includes the same data as the environmental parameters 22 and the work instructions 21 used in the calculations to be performed from now on, there is a high probability that the accuracy is higher than the learning data 25 before updating. The above is the description of FIG.
  • FIG. 10 is a flowchart showing proxy model generation processing by the proxy model generation unit 41.
  • FIG. FIG. 10 shows details of step S31 shown in FIG.
  • the proxy model generation unit 41 determines the reference value and variation range of the environment parameter 22 .
  • the proxy model generation unit 41 may adopt the variation range described in the assumed variation range 23 or randomly determine the values of any of the detailed parameters included in the environmental parameters 22 .
  • the proxy model generation unit 41 sets the picking speed to 150 pieces per hour, the number of AGVs to 20 units, and the speed of the AGV to 10 km/h as the reference values of the environmental parameters 22 .
  • the picking speed is ⁇ 50 pieces/hour
  • the number of AGVs is ⁇ 5 units
  • the AGV speed is ⁇ 2 km/h.
  • the proxy model generation unit 41 randomly generates the environmental parameters 22 within the variation range determined in step S301. For example, if 10 picking speeds, the number of AGVs, and 10 AGV speeds are randomly calculated in step S302, the environment parameter 22 is calculated in 10 to the power of 10 to the power of 1000.
  • the proxy model generation unit 41 randomly generates multiple execution plans, that is, work instructions and work orders.
  • the surrogate model generation unit 41 combines the plurality of environment parameters 22 generated in step S302 and the plurality of execution plans generated in step S303, inputs them to the strict evaluation unit 51, and calculates the required time for each. do. For example, if there are 1000 environment parameters 22 generated in step S302 and 100 execution plans generated in step S303, the strict evaluation unit 51 performs 10,000 calculations in step S304.
  • step S315 the proxy model generation unit 41 puts together the environment parameters 22 and the execution plan input to the strict evaluation unit 51 in step S304 and the required time output by the strict evaluation unit 51 at that time as a set of learning data.
  • 10,000 sets of learning data are obtained.
  • step S316 the proxy model generation unit 41 generates the proxy model 27 using the plurality of learning data obtained in step S305. Assuming that the execution plan is X, the environment parameter 22 is ⁇ , and the required time is Y, the proxy model 27 corresponds to the function f in Equation 1 below.
  • the proxy model 27 may be realized by machine learning such as a neural network that approximates simulation evaluation, may be a more abstract simulation model than the strict evaluation unit 51, or may be a simple formula. The above is the description of the proxy model generation processing.
  • FIG. 11 is a flowchart showing evaluation scenario generation processing by the evaluation scenario generation unit 43.
  • FIG. FIG. 11 shows details of step S33 shown in FIG.
  • the evaluation scenario generator 43 acquires the current values of the environmental parameters 22.
  • the evaluation scenario generator 43 determines the variation range of the environment parameter 22.
  • the evaluation scenario generator 43 adopts the value described in the assumed variation range 23 .
  • the evaluation scenario generation unit 43 randomly generates the values of the environmental parameters 22 within the range determined in step S332, centering on the values obtained in step S331. For example, if the value of the detailed parameter "picking speed" acquired in step S331 is "150" and the range of "picking speed” determined in step S332 is " ⁇ 30”, A plurality of values are randomly determined within the range of ⁇ 30”, that is, within the range of “120” to “180”.
  • the evaluation scenario generation unit 43 puts together the plurality of environmental parameters 22 determined in step S333 and saves them in the storage unit 13 as an evaluation scenario.
  • the number of environmental parameters 22 included in the evaluation scenario is not particularly limited. For example, all of the detailed parameter values determined in step S333 may be combined. The above is the description of the evaluation scenario generation processing.
  • FIG. 12 is a flow chart showing plan calculation processing by the plan generating unit 44.
  • FIG. FIG. 12 shows details of step S34 shown in FIG.
  • step S341 the draft plan generation unit 44 randomly generates a work plan, and proceeds to step S342.
  • step S342 the plan generation unit 44 selects one unselected work plan from the work instructions randomly generated in step S341, and proceeds to step S343.
  • step S343 the plan generation unit 44 selects one unselected environmental parameter 22 from the evaluation scenario.
  • the draft plan generation unit 44 inputs the environmental parameters 22 selected in step S342 and the work plan selected in step S342 to the proxy model 27.
  • the draft plan generation unit 44 inputs the environmental parameters 22 and the work plan to the simple evaluation unit 52 that performs calculations using the proxy model 27 .
  • the assumed required time calculated by the proxy model 27 in step S344 is temporarily recorded.
  • step S346 the plan generation unit 44 determines whether or not all environmental parameters 22 included in the evaluation scenario have been selected in step S343.
  • the draft plan generation unit 44 proceeds to step S347 when determining that all the environmental parameters 22 have been selected, and returns to step S343 when determining that at least one unselected environmental parameter 22 exists. That is, if an affirmative determination is made in this step, it means that the expected required times corresponding to all the environmental parameters 22 included in the evaluation scenario for a work plan have all been calculated.
  • step S347 the plan generating unit 44 calculates and records the average value of the estimated travel times temporarily recorded in step S345. When the recording of the average value is completed, all the values temporarily recorded in step S345 are erased.
  • step S348 the draft plan generation unit 44 determines whether or not all the work plans randomly generated in step S341 have been selected in step S342.
  • the draft plan generation unit 44 proceeds to step S349 when determining that all the work plans have been selected, and returns to step S342 when determining that at least one unselected work plan exists. Note that if a negative determination is made in this step, the selection status of the environmental parameters 22 is reset, and it is considered that none of the environmental parameters 22 have been selected so far.
  • step S349 the plan generation unit 44 specifies the setting of the provisional work plan and the average required time based on the proxy model of the provisional work plan. Specifically, the draft plan generation unit 44 first identifies the minimum value from the average values recorded in step S347, and sets the work plan corresponding to the minimum average value as the provisional work plan. The above is the description of FIG.
  • the computing device 1 creates a work plan for a given work in an environment in which information about the changing environment can be expressed as the environment parameters 22 .
  • the computing device 1 uses a strict evaluation unit 51 that calculates the required time for a given work, an evaluation scenario generation unit 43 that generates a plurality of environmental parameters 22 as an evaluation scenario based on the latest environmental parameters 22, and learning data 25.
  • a proxy model generation unit 41 that creates a proxy model 27 for calculating the required time for a given task more easily than the strict evaluation unit 51; 22, which is a work plan suitable for any of 22, is calculated using the draft plan generation unit 44 and the strict evaluation unit 51, and is the required time required for a predetermined work in the provisional work plan.
  • the provisional work plan and the strict and a proxy model updating unit 42 that updates the proxy model 27 using the required time. Therefore, when the accuracy of the proxy model 27 is low and there is a discrepancy between the calculation result using the proxy model 27 and the calculation result using the strict evaluation unit 51, the calculation result of the strict evaluation unit 51 is used to update the proxy model 27. and the accuracy of the proxy model 27 used for simple calculation can be improved.
  • the environment parameter 22 includes information on the speed at which a given task is executed, that is, the picking speed.
  • the evaluation scenario generation unit 43 generates an evaluation scenario based on the assumed variation range 23 describing the range in which the environmental parameters 22 are to be varied.
  • the arithmetic device 1 is explained as one hardware device.
  • the arithmetic device 1 may be composed of a plurality of pieces of hardware, and each function may be realized by a different computer.
  • the functions of the arithmetic unit 1 may be realized by a plurality of pieces of hardware that are physically separated and connected by a network.
  • FIG. 13 and 14 A second embodiment of the arithmetic device will be described with reference to FIGS. 13 and 14.
  • FIG. In the following description, the same components as those in the first embodiment are assigned the same reference numerals, and differences are mainly described. Points that are not particularly described are the same as those in the first embodiment.
  • This embodiment differs from the first embodiment mainly in that the calculation is redone if the environmental parameter fluctuates greatly during the calculation.
  • FIG. 13 is a configuration diagram of an arithmetic device 1A according to the second embodiment.
  • the arithmetic device 1A further includes a disturbance evaluation section 45 in addition to the configuration in the first embodiment.
  • the disturbance evaluation unit 45 evaluates the deviation between the environmental parameters 22 at the start of the operation of the plan generating unit 44 and the current environmental parameters 22 .
  • FIG. 14 is a flow chart showing an overview of the processing of the arithmetic device 1A according to the second embodiment.
  • step S39 is added between steps S34 and S35.
  • the disturbance evaluation unit 45 compares the value of the environmental parameter 22 acquired at the beginning of step S33, that is, step S331 of FIG. Determines whether or not there has been a large change from the time of execution.
  • the disturbance evaluation unit 45 returns to step S33 if it determines that there has been a large change, and proceeds to step S35 if it determines that there has not been a large change.
  • the criteria for determining whether or not the environmental parameter 22 fluctuates significantly may be determined separately for each detailed parameter, or the value of the expected fluctuation range 23 may be used.
  • the evaluation scenario generator 43 generates an evaluation scenario based on the start-time environmental parameters, which are the latest environmental parameters 22 . If the difference between the environmental parameters at completion, which are the environmental parameters 22 when the calculation of the provisional work plan using the evaluation scenario is completed, and the environmental parameters at start is greater than or equal to a predetermined threshold, the draft plan generation unit 44 , causes the evaluation scenario generator 43 to generate an evaluation scenario using the latest environmental parameters 22, and calculates the provisional work plan again. Therefore, since the environmental parameters 22 fluctuate in a short period of time, it is impossible to perform calculations using the values of the environmental parameters 22 that completely match. Since a draft plan is generated again when 22 fluctuates significantly, a draft plan using the environmental parameters 22 that are less different from the actual ones can be generated.
  • the provisional work plan may be calculated again when the elapsed time from the start of calculation exceeds a predetermined threshold.
  • step S39 in FIG. 14 may be changed to make an affirmative determination and return to step S33 when the elapsed time from the start of the process of step S33 exceeds a predetermined time.
  • a branch to return to step S33 may be added when the elapsed time from the start of the process of step S33 exceeds a predetermined time.
  • FIG. 15 to 19 A third embodiment of the arithmetic device will be described with reference to FIGS. 15 to 19.
  • FIG. In the following description, the same components as those in the first embodiment are assigned the same reference numerals, and differences are mainly described. Points that are not particularly described are the same as those in the first embodiment.
  • the present embodiment differs from the first embodiment mainly in that a plurality of proxy models are selectively used.
  • FIG. 15 is a configuration diagram of an arithmetic device 1B according to the third embodiment.
  • the arithmetic device 1A further stores parameter divisions 28 in the storage unit 13 .
  • the storage unit 13 stores the learning data 25A and the proxy model information 26A.
  • the proxy model 27 has the advantage of having a smaller amount of calculation than the strict evaluation unit 51, but the calculation accuracy tends to decrease when the value of the environmental parameter 22 changes. Therefore, a plurality of proxy models 27 are generated in advance and the proxy models 27 are selectively used according to the values of the environmental parameters 22 .
  • the values of the environmental parameters 22 are divided into a plurality of divisions in advance, and a data set is formed for each division. Then, we generate a surrogate model for each of these datasets.
  • Information indicating the categories of the environmental parameters 22 is stored as parameter categories 28 in the storage unit 13 . Since a plurality of proxy models 27 are generated in the present embodiment, learning data 25A and proxy model information 26A for generating these plurality of proxy models 27 are also different from those in the first embodiment.
  • FIG. 16 is a diagram showing an example of the parameter division 28.
  • the parameter section 28 shows the correspondence relationship between the data set ID and the value range of the environment parameter 22 .
  • the range of the value of the environment parameter 22 corresponding to the data set ID "DS001" is "8 to 12 units" for the number of AGVs and "80 to 120 pieces/hour" for the picking speed.
  • the value range of the environment parameter 22 corresponding to the dataset ID "DS002" shown below is different from the first dataset in that the picking speed is the same, but the number of AGVs is "13 to 20". .
  • the values of the environmental parameters 22 of the data sets need not be completely identical, and the range of values may overlap.
  • FIG. 17 is a diagram showing an example of learning data 25A in this embodiment. A difference from the learning data 25 in the first embodiment is that data set ID information is added. In the example shown in FIG. 17, data of two sample IDs whose environmental parameters 22 are included in the same section are shown.
  • FIG. 18 is a diagram showing an example of the proxy model information 26A in this embodiment.
  • the difference from the proxy model information 26 in the first embodiment is that the proxy model ID, which is the identifier of the proxy model, and the dataset ID indicating the dataset used to generate the proxy model are added. is.
  • FIG. 19 is a flow chart showing an overview of the processing of the arithmetic device 1B according to the third embodiment.
  • step S391 is added between steps S33 and S34.
  • the plan generation unit 44 selects the optimum proxy model 27, and uses that proxy model 27 in step S34 and subsequent steps.
  • the specific processing of the plan generation unit 44 in this step is as follows. First, the draft plan generator 44 reads the values of the current environmental parameters 22 and identifies the data set ID corresponding to the range in which the values of the current environmental parameters 22 are included in the parameter section 28 . Then, the plan generation unit 44 refers to the proxy model information 26A, reads the values of the internal parameters of the proxy model 27 corresponding to the identified data set ID, and uses the proxy model 27.
  • the evaluation scenario generation unit 43 generates a plurality of evaluation scenarios with different ranges of environmental parameter values.
  • the proxy model generation unit 41 generates a proxy model 27 corresponding to each evaluation scenario, and the plan generation unit 44 selects one of the proxy models 27 according to the value of the environment parameter 22 . Therefore, by selecting the proxy model 27 according to the situation, it is possible to improve the accuracy of the calculation.
  • FIG. 20 is a flow chart showing an overview of the processing of the arithmetic device 1B in this modified example.
  • step S391 is added between steps S33 and S34, and step S39 is added between steps S34 and S35.
  • the configuration of the functional blocks is merely an example. Some functional configurations shown as separate functional blocks may be configured integrally, or a configuration represented by one functional block diagram may be divided into two or more functions. Further, a configuration may be adopted in which part of the functions of each functional block is provided in another functional block.
  • the program is stored in the ROM 12 in each of the above-described embodiments and modifications, the program may be stored in the storage unit 13.
  • the arithmetic device 1 may have an input/output interface (not shown), and the program may be read from another device via a medium that can be used by the input/output interface and the arithmetic device 1 when necessary.
  • the medium refers to, for example, a storage medium that can be attached to and detached from an input/output interface, or a communication medium, that is, a wired, wireless, or optical network, or a carrier wave or digital signal that propagates through the network.
  • part or all of the functions realized by the program may be realized by a hardware circuit or FPGA.

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

演算装置は、変動する環境に関する情報を環境パラメータとして表現可能な環境において、所定の作業に関する作業計画を作成する演算装置であって、所定の作業に関する所要時間を算出する厳密評価部と、最新の環境パラメータに基づき複数の環境パラメータを評価シナリオとして生成する評価シナリオ生成部と、学習データを用いて、厳密評価部よりも簡易に所定の作業に関する所要時間を算出するための代理モデルを作成する代理モデル生成部と、代理モデルを用いて所要時間を算出し、複数の環境パラメータのいずれにも適する作業計画である暫定作業計画を算出する計画案生成部と、厳密評価部を用いて算出された時間であり、暫定作業計画における所定の作業に要する所要時間である厳密所要時間と、代理モデルを用いて算出された時間であり暫定作業計画における所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、暫定作業計画および厳密所要時間を用いて代理モデルを更新する、代理モデル更新部とを備える。

Description

演算装置、作業計画の作成方法、演算システム
 本発明は、演算装置、作業計画の作成方法、および演算システムに関する。
 効率よく作業を進めるために、事前に作業計画を作成することが広く行われている。ただし、作業環境の条件が時間の経過とともに変化する場合には最適な作業計画を作成することが容易ではない。特許文献1には、機械学習により機械に対する制御指令を学習する機械学習装置であって、前記機械学習を行って前記制御指令を出力する機械学習器と、前記制御指令に基づいて、前記機械の作業動作のシミュレーションを実行するシミュレータと、前記シミュレータによる前記シミュレーションの実行結果に基づいて、前記制御指令を判定する第1判定器と、を備える、ことを特徴とする機械学習装置が開示されている。
日本国特開2017-185577号公報
 特許文献1に記載されている発明では、演算の精度に改善の余地がある。
 本発明の第1の態様による演算装置は、変動する環境に関する情報を環境パラメータとして表現可能な環境において、所定の作業に関する作業計画を作成する演算装置であって、前記所定の作業に関する所要時間を算出する厳密評価部と、最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成部と、学習データを用いて、前記厳密評価部よりも簡易に前記所定の作業に関する所要時間を算出するための代理モデルを作成する代理モデル生成部と、前記代理モデルを用いて前記所要時間を算出し、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成部と、前記厳密評価部を用いて算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新部とを備える。
 本発明の第2の態様による作業計画の作成方法は、変動する環境に関する情報を環境パラメータとして表現可能な環境を対象として、所定の作業に関する作業計画を演算装置が作成する、作業計画の作成方法であって、前記所定の作業に関する所要時間を算出する厳密評価処理と、最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成処理と、学習データを用いて、前記厳密評価処理よりも簡易に前記所定の作業に関する演算を行うための代理モデルを作成する代理モデル生成処理と、前記代理モデルを用いて前記所定の作業に関する演算を行い、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成処理と、前記厳密評価処理により算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新処理とを含む。
 本発明の第3の態様による演算システムは、変動する環境に関する情報を環境パラメータとして表現可能な環境において、所定の作業に関する作業計画を作成する演算システムであって、前記所定の作業に関する所要時間を算出する厳密評価部と、最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成部と、学習データを用いて、前記厳密評価部よりも簡易に前記所定の作業に関する演算を行うための代理モデルを作成する代理モデル生成部と、前記代理モデルを用いて前記所定の作業に関する演算を行い、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成部と、前記厳密評価部を用いて算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新部とを備える。
 本発明によれば、簡易な計算の精度を向上できる。
演算装置が適用可能なアプリケーションの一例を示す表 第1の実施の形態における演算装置の構成図 作業指示の一例を示す図 環境パラメータの一例を示す図 想定変動範囲の一例を示す図 許容予測誤差情報の一例を示す図 学習データの一例を示す図 代理モデル情報の一例を示す図 第1の実施の形態における演算装置による処理の概要を示すフローチャート 代理モデル生成処理を示すフローチャート 評価シナリオ生成処理を示すフローチャート 計画案算出処理を示すフローチャート 第2の実施の形態における演算装置の構成図 第2の実施の形態における演算装置の処理の概要を示すフローチャート 第3の実施の形態における演算装置の構成図 パラメータ区分の一例を示す図 学習データの一例を示す図 代理モデル情報の一例を示す図 第3の実施の形態における演算装置の処理の概要を示すフローチャート 第3の実施の形態の変形例における演算装置の処理の概要を示すフローチャート
(対象アプリケーション)
 本発明に係る演算装置は、変動環境下における作業計画の立案を行う。演算装置は様々な環境が変化する様々なアプリケーションに適用できる。
 図1は、演算装置が適用可能なアプリケーションの一例を示す表である。図1では、アプリケーションごとに、演算装置が指示される内容、演算装置の計算結果、および変動する環境パラメータを示している。環境パラメータとは、アプリケーションに影響を及ぼし、かつ短時間で変動しうるパラメータである。ここでいう「短時間」とは、演算装置が演算に要する時間に対して短いことを意味する。環境パラメータは、時間が経過するほど変化幅が大きい傾向にある。そのため、計算に長い時間を要するほど計算開始時と計算終了時における環境パラメータの変動幅が大きくなる。図1に示す「計算結果」は、演算装置が算出した「作業計画」と言い換えることができる。
 図1の1レコード目に示す「商品ピッキング」のアプリケーションでは、倉庫内に無数に格納されている商品をAGV(Automatic Guided Vehicle)がピッキングする。演算装置には、商品名とその商品のピッキングが完了すべき時刻の組合せられたリストが入力される。なお各商品の倉庫内の位置は、AGVおよび演算装置にとって既知である。
 倉庫内は広大であり、ピッキングする商品が格納されている場所までAGVが移動するために時間を要する。そのため演算装置は、それぞれのAGVが、どの商品をどの順番でピッキングするかを計算して出力する。ただし次のような環境パラメータが短時間で変動しうる。図1に示すように、「商品ピッキング」のアプリケーションにおける環境パラメータはたとえば、ピッキング速度、AGVの数、およびAGVの速度である。
 たとえば、AGVが商品をピックアップする速度であるピッキング速度は、様々な要因により変動する。また、AGVは故障や充電などにより稼働可能な台数は一定ではない。さらに、床面の状態などによりAGVが走行可能な最高速度が変動する。これらの環境パラメータは、比較的短い期間では変化幅が小さいが、期間が長くなるほどその変化が積み重なって大きな変化幅となる可能性がある。
 図1の2レコード目に示す「宅配」のアプリケーションでは、配達員が住宅に荷物を配達する。演算装置には、住所と期限時刻のリストが入力される。なお、住所と配達すべき荷物との紐づけは別途管理される。演算装置は、作業員ごとの配達先の訪問順序を出力する。このアプリケーションではたとえば、渋滞や通行止めなどの道路状況や、天候により変化する作業員の移動速度が環境パラメータとなる。
 図1の3レコード目に示す「多品種生産」のアプリケーションでは、複数の生産装置を用いて製品を生産する。演算装置には、品名と出荷時刻のリストが入力される。演算装置は、生産装置ごとの製品の加工の順番を出力する。このアプリケーションではたとえば、生産装置の台数と種類や、生産装置の動作速度が環境パラメータとなる。本発明は図1に示した例に限定されず様々なアプリケーションに適用できるが、第1の実施の形態では「商品ピッキング」を例に説明する。
―第1の実施の形態―
 以下、図2~図12を参照して、演算装置の第1の実施の形態を説明する。
 図2は、第1の実施の形態における演算装置1の構成図である。演算装置1は、中央演算装置であるCPU11、読み出し専用の記憶装置であるROM12、不揮発性の記憶装置である記憶部13、および高速な読み書きが可能な記憶装置であるメモリ14を備える。CPU11がROM12に格納されるプログラムをメモリ14に展開して実行することで後述する演算を行う。
 演算装置1は、CPU11、ROM12、およびメモリ14の組み合わせの代わりに書き換え可能な論理回路であるFPGA(Field Programmable Gate Array)や特定用途向け集積回路であるASIC(Application Specific Integrated Circuit)により後述する機能を実現してもよい。また演算装置1は、CPU11、ROM12、およびメモリ14の組み合わせの代わりに、異なる構成の組み合わせ、たとえばCPU11、ROM12、メモリ14とFPGAの組み合わせにより実現されてもよい。
 演算装置1はその機能として、代理モデル生成部41と、代理モデル更新部42と、評価シナリオ生成部43と、計画案生成部44と、外乱評価部45と、厳密評価部51と、簡易評価部52と、を備える。これらの機能は前述のとおり、たとえばCPU11がROM12に格納されるプログラムをメモリ14に展開して実行することで実現されるので、図2ではこれらの機能を便宜的にメモリ14の内部に記載している。
 演算装置1の記憶部13には、作業指示21と、環境パラメータ22と、想定変動範囲23と、許容予測誤差24と、学習データ25と、代理モデル情報26と、代理モデル27とが格納される。ただし代理モデル27は図2に便宜的に記載しており、代理モデル27の主要な構成は代理モデル情報26である。詳しくは後述する。
 代理モデル生成部41は、1または複数の代理モデル27を生成する。代理モデル更新部42は、代理モデル生成部41が生成した代理モデル27を更新する。評価シナリオ生成部43は、現在時刻における環境パラメータ22を取得し、所定の範囲内でランダムに変動させた評価シナリオを複数生成する。計画案生成部44は、評価シナリオ生成部43が生成した複数の評価シナリオと、簡易評価部52とを用いて、暫定的な作業計画である暫定計画案と、暫定計画案の近似評価値とを算出する。
 厳密評価部51は、不図示の厳密なモデルを用いて演算コストが高い高精度な評価を行う。厳密評価部51はたとえばシミュレータであり、ピッキング作業における個々の商品のピッキング動作や、ピッキングのための移動などをシミュレートして、必要な作業時間を算出する。簡易評価部52は、代理モデル27を用いて演算コストが低い簡易な評価を行う。代理モデル27は、シミュレーション評価を近似するニューラルネットワークなど、機械学習により実現してもよいし、厳密評価部51よりも抽象的なシミュレーションモデルでもよいし、単純な数式でもよい。
 厳密評価部51による評価は、簡易評価部52との比較において精度が高い。簡易評価部52による評価は、厳密評価部51との比較において精度が低い。演算コストとはたとえば、計算量、計算時間、および計算に要する演算資源の量などの多少を意味する。たとえば厳密評価部51と簡易評価部52が同一の演算用ハードウエアを用いる場合には、厳密評価部51は簡易評価部52よりも評価の完了に長時間を要する。また仮に厳密評価部51と簡易評価部52とが同一の時間で評価を完了するためには、厳密評価部51は簡易評価部52よりも多くの演算資源を要する。具体的には厳密評価部51と簡易評価部52とが同一の時間で評価を完了するためには、厳密評価部51は簡易評価部52よりも多くの演算コアを使用することや、厳密評価部51は簡易評価部52よりも単位時間当たりの演算量が多い演算コアを用いる必要がある。
 仮に演算コストの制限がなければ、簡易評価部52を利用する利点はなく常に厳密評価部51を用いることが望ましい。しかし実際には演算コストの制限があるため、本実施の形態では厳密評価部51と簡易評価部52とを効率的に組み合わせて使用する。さらに本実施の形態では、簡易評価部52を適宜改善および選択することで厳密評価部51の精度の低さを補う。
 図3は、作業指示21の一例を示す図である。この例では、作業指示21には、作業指示IDと、商品と、期限時刻と、出庫数との組合せが複数組含まれる。図3の最初のレコードでは、商品「A」を「6」つ、「17:00」までに用意することが指示されている。なお作業指示IDは個別の作業指示を識別する識別子であり、作業指示21に含まれなくてもよい。また、出庫数の代わりに同様の指示が繰り返されてもよく、たとえば商品「A」と期限時刻「17:00」が6レコード連続で記録されてもよい。
 図4は、環境パラメータ22の一例を示す図である。環境パラメータ22は、詳細パラメータと値との組合せが複数含まれる。具体的には環境パラメータ22には、AGVの台数やピッキング速度などのパラメータが格納される。前述のように環境パラメータ22は短い時間で変化するので、ここに示す環境パラメータ22はあるタイミングでの値にすぎない。演算装置1は、不図示の他の装置から環境パラメータ22を取得してもよいし、演算装置1に接続された不図示のセンサなどから環境パラメータ22を構成する個々の値を取得してもよい。
 図5は、想定変動範囲23の一例を示す図である。想定変動範囲23には、環境パラメータ22の詳細パラメータごとに、想定される変動範囲が記載される。なお、想定変動範囲23の変動幅は、過去の詳細パラメータの統計情報に基づいて設定してもよいし、オペレータが任意に設定してもよい。なお、想定変動範囲23の値は統計値や任意に設定した値にすぎないので、実際には環境パラメータ22が想定変動範囲23に記載されている範囲を超えて変動することもあり得る。ただし本実施の形態では、環境パラメータ22が想定変動範囲23を超えて変動することに対して積極的な対策を行わない。図5に示す例では、AGV台数が±2台であること、ピッキング速度が±20個/時であること、などが示されている。
 図6は、許容予測誤差情報G4の一例を示す図である。許容予測誤差情報G4は、許容可能な厳密評価部51と簡易評価部52との予測誤差の範囲を定めている。許容予測誤差情報G4の値はたとえば、オペレータが任意に設定する。図6の最初のレコードでは、全作業の完了に要する所要時間が±30分以内であれば許容されることが記載されている。なおこの「所要時間」は、「作業時間」や「処理時間」と呼ぶこともできる。図6の2つ目のレコードには、納期までの余裕時間が±15%であれば許容されることが記載されている。
 図7は、学習データ25の一例を示す図である。学習データ25には、代理モデル27の生成に用いられるデータが格納される。学習データ25には、予めデータが格納されてもよいし、後述する代理モデル生成処理が開始される時点では空、すなわち何もデータが格納されていなくてもよい。学習データ25には、代理モデル生成処理と後述する更新処理によりデータが追加される。
 学習データ25には、複数のサンプルが含まれる。それぞれのサンプルには、厳密評価部51への入力と厳密評価部51の出力が含まれる。図7に示す例では、学習データ25の各レコードは、サンプルを識別するサンプルID、厳密評価部51への入出力の区別を示すデータ属性、データ名、およびデータ値が含まれる。同一のサンプルIDを有する学習データ25のレコードであって、データ属性が「入力」であるレコードの情報は、同一のタイミングで厳密評価部51に入力される。
 学習データ25におけるデータ名とデータ値の組合せは、作業指示21のあるレコードに対応する。サンプルIDの相違は、環境パラメータの値が異なることを示している。なお図7には示されていないが、それぞれのサンプルIDに対応する環境パラメータの具体的な値も別途記録されている。
 図8は、代理モデル情報26の一例を示す図である。代理モデル情報26には、学習データ25を用いて生成された代理モデル27の情報である内部パラメータの名称とその値が格納される。図8に示す例では、代理モデル情報26には内部パラメータを識別する内部パラメータIDごとに、そのパラメータ値の情報が格納される。
 不図示の代理モデル27に関する情報と、代理モデル情報26とを組み合わせることで、代理モデル27が構成される。代理モデル27はたとえばニューラルネットワークであり、不図示の代理モデル27の構成に関する情報と、代理モデル情報26に格納されたパラメータとが組み合わされることで代理モデル27を用いた演算が可能となる。またたとえば代理モデル27は多項式であり、不図示の多項式の数式と、代理モデル情報26に格納された多項式中の係数の値とが組み合わされることで代理モデル27を用いた演算が可能となる。以上が記憶部13に格納される情報の説明である。
(演算装置の処理の概要)
 図9は、演算装置1による処理の概要を示すフローチャートである。まずステップS31では、代理モデル生成部41が代理モデル27を生成する。この処理は作業指示21を受信する前にあらかじめ実行しておく。次にステップS32において演算装置1は、外部から作業指示21、たとえば商品名と期限時刻のリストを取得する。次にステップS33において、評価シナリオ生成部43は、その時刻tにおける環境パラメータ22の値を取得し、この値を基準としてランダムに変化させた複数の仮想的な環境パラメータ(以下、「評価シナリオ」と呼ぶ)を生成する。
 続くステップS34では計画案生成部44は、代理モデル27を用いて最適な作業計画(以下では「暫定作業計画」と呼ぶ)を算出し、さらに評価シナリオに暫定作業計画を適用した場合の平均所要時間を代理モデル27を用いて算出する。ここでいう「最適」とは、ステップS33において生成した複数の環境パラメータに対しても平均的に所要時間が短い、という意味である。なお本ステップにおいて算出する平均所要時間は、代理モデル27を用いて算出するため「代理所要時間」とも呼ぶ。
 続くステップS35では厳密評価部51は、評価シナリオにステップS34において算出した暫定作業計画を適用した場合の平均所要時間を算出する。すなわち厳密評価部51は、評価シナリオに含まれる環境パラメータ22の数と同じ回数の演算を行ってそれぞれの所要時間を算出し、それらの平均値を算出する。なお本ステップにおいて算出する平均所要時間は、厳密評価部51を用いて算出するため「厳密所要時間」とも呼ぶ。
 続くステップS36では計画案生成部44は、ステップS34において算出された暫定作業計画の平均所要時間と、ステップS35において算出された暫定作業計画の平均所要時間との差が閾値以内であるか否かを判断する。換言すると、本ステップにおいて計画案生成部44は、代理所要時間と厳密所要時間との差が閾値以内であるか否かを判断する。
 計画案生成部44は、2つの平均所要時間の差が閾値以内であると判断する場合は、ステップS37に進んで暫定作業計画を出力して図9の処理を終了する。計画案生成部44は、2つの平均所要時間の差が閾値以上であると判断する場合はステップS38に進む。
 ステップS38では代理モデル更新部42は、ステップS35における厳密評価部51への入力および同ステップにおける厳密評価部51の出力を学習データ25に追加し、さらにこの学習データ25を用いて代理モデル27を更新してステップS34に戻る。代理モデル27の更新とは、代理モデル情報26におけるパラメータ値の更新である。なお、ステップS38から遷移して実行されるステップS34では、初回のステップS34とは異なる、更新された代理モデル27が使用される。更新された代理モデル27の学習データ25には、これから行う演算で用いる環境パラメータ22および作業指示21と同一のデータが含まれるため、更新前の学習データ25よりも精度が高まる蓋然性が高い。以上が図9の説明である。
 図10は、代理モデル生成部41による代理モデル生成処理を示すフローチャートである。図10は、図9に示したステップS31の詳細を示す。ステップS311では代理モデル生成部41は、環境パラメータ22の基準値および変動範囲を決定する。代理モデル生成部41は、想定変動範囲23に記載された変動範囲を採用してもよいし、環境パラメータ22に含まれるいずれかの詳細パラメータの値をランダムに決定してもよい。代理モデル生成部41はたとえば環境パラメータ22の基準値として、ピッキング速度を1時間当たり150個、AGVの台数を20台、AGVの速度を時速10kmとする。また、環境パラメータ22の変動範囲として、ピッキング速度を±50個/時、AGVの台数を±5台、AGVの速度を±時速2kmとする。
 続くステップS312では代理モデル生成部41は、ステップS301において決定した変動範囲で環境パラメータ22をランダムに生成する。たとえばステップS302において、ピッキング速度、AGVの台数、およびAGVの速度のそれぞれをランダムに10個算出した場合には環境パラメータ22は10の3乗で1000通り算出される。
 続くステップS313では代理モデル生成部41は、実行計画、すなわち作業指示および作業順序をランダムに複数生成する。続くステップS314では代理モデル生成部41は、ステップS302において生成した複数の環境パラメータ22と、ステップS303において生成した複数の実行計画とを組み合わせて厳密評価部51に入力し、それぞれの所要時間を算出する。たとえば、ステップS302において生成した環境パラメータ22が1000通りあり、ステップS303において生成した実行計画が100通りある場合には、ステップS304では厳密評価部51は1万回の演算を行う。
 ステップS315では代理モデル生成部41は、ステップS304において厳密評価部51に入力した環境パラメータ22および実行計画と、その際に厳密評価部51が出力した所要時間とを1組の学習データとしてまとめる。前述の例では、学習データが1万組得られる。続くステップS316では代理モデル生成部41は、ステップS305において得られた複数の学習データを用いて代理モデル27を生成する。実行計画をX、環境パラメータ22をθ、所要時間をYと置くと、代理モデル27は次の式1における関数fに相当する。
   Y≒f(X、θ) ・・・・(式1)
 代理モデル27は、シミュレーション評価を近似するニューラルネットワークなど、機械学習により実現してもよいし、厳密評価部51よりも抽象的なシミュレーションモデルでもよいし、単純な数式でもよい。以上が代理モデル生成処理の説明である。
 図11は、評価シナリオ生成部43による評価シナリオ生成処理を示すフローチャートである。図11は、図9に示したステップS33の詳細を示す。ステップS331では評価シナリオ生成部43は、現在の環境パラメータ22の値を取得する。続くステップS332では評価シナリオ生成部43は、環境パラメータ22の変動範囲を決定する。たとえば評価シナリオ生成部43は、想定変動範囲23に記載された値を採用する。
 続くステップS333では評価シナリオ生成部43は、環境パラメータ22の値をステップS331において取得した値を中心として、ステップS332において決定した範囲でランダムに生成する。たとえばステップS331において取得した詳細パラメータ「ピッキング速度」の値が「150」であり、ステップS332において決定した「ピッキング速度」の範囲が「±30」の場合には、「150」を中心とした「±30」の範囲、すなわち「120」~「180」の範囲でランダムに複数の値を決定する。
 続くステップS334では評価シナリオ生成部43は、ステップS333において決定した複数の環境パラメータ22をまとめて、評価シナリオとして記憶部13に保存する。評価シナリオに含まれる環境パラメータ22の数は特に限定されない。たとえば、ステップS333において決定したそれぞれの詳細パラメータの値を全とおり組み合わせてもよい。以上が評価シナリオ生成処理の説明である。
 図12は、計画案生成部44による計画案算出処理を示すフローチャートである。図12は、図9に示したステップS34の詳細を示す。ステップS341では計画案生成部44は、作業計画をランダムに生成してステップS342に進む。ステップS342では計画案生成部44は、ステップS341においてランダム生成した作業指示から未選択の作業計画を1つ選択してステップS343に進む。
 ステップS343では計画案生成部44は、評価シナリオの中から未選択の環境パラメータ22を1つ選択する。続くステップS344では計画案生成部44は、ステップS342において選択した環境パラメータ22と、ステップS342において選択した作業計画とを代理モデル27に入力する。厳密には計画案生成部44は、代理モデル27を用いて演算を行う簡易評価部52に環境パラメータ22および作業計画を入力する。続くステップS345では、ステップS344において代理モデル27が算出した想定所要時間を一時記録する。
 続くステップS346では計画案生成部44は、評価シナリオに含まれる全ての環境パラメータ22をステップS343において選択したか否かを判断する。計画案生成部44は、全ての環境パラメータ22を選択したと判断する場合はステップS347に進み、1つでも未選択の環境パラメータ22が存在すると判断する場合はステップS343に戻る。すなわち本ステップにおいて肯定判断がされる場合は、ある作業計画について評価シナリオに含まれる全ての環境パラメータ22に対応する想定所要時間が全て算出済みの状況である。
 ステップS347では計画案生成部44は、これまでにステップS345において一時記録した想定所要時間の平均値を算出して記録する。平均値の記録が完了すると、ステップS345において一時記録した値は全て消去される。
 続くステップS348では計画案生成部44は、ステップS341においてランダム生成した全ての作業計画を、ステップS342において選択したか否かを判断する。計画案生成部44は、全ての作業計画を選択したと判断する場合はステップS349に進み、1つでも未選択の作業計画が存在すると判断する場合はステップS342に戻る。なお本ステップにおいて否定判断をした場合には、環境パラメータ22の選択状況はリセットされ、これまでにいずれの環境パラメータ22も選択されていないとみなされる。
 ステップS349では計画案生成部44は、暫定作業計画の設定、および暫定作業計画の代理モデルによる平均所要時間を特定する。具体的には計画案生成部44は、まず、ステップS347において記録した平均値から最小値を特定し、その最小の平均値に対応する作業計画を暫定作業計画に設定する。以上が図12の説明である。
 上述した第1の実施の形態によれば、次の作用効果が得られる。
(1)演算装置1は、変動する環境に関する情報を環境パラメータ22として表現可能な環境において、所定の作業に関する作業計画を作成する。演算装置1は、所定の作業に関する所要時間を算出する厳密評価部51と、最新の環境パラメータ22に基づき複数の環境パラメータ22を評価シナリオとして生成する評価シナリオ生成部43と、学習データ25を用いて、厳密評価部51よりも簡易に所定の作業に関する所要時間を算出するための代理モデル27を作成する代理モデル生成部41と、代理モデル27を用いて所要時間を算出し、複数の環境パラメータ22のいずれにも適する作業計画である暫定作業計画を算出する計画案生成部44と、厳密評価部51を用いて算出された時間であり、暫定作業計画における所定の作業に要する所要時間である厳密所要時間と、代理モデル27を用いて算出された時間であり暫定作業計画における所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、暫定作業計画および厳密所要時間を用いて代理モデル27を更新する、代理モデル更新部42とを備える。そのため、代理モデル27の精度が低く、代理モデル27を用いた計算結果と厳密評価部51を用いた計算結果に乖離がある場合に、厳密評価部51の計算結果を用いて代理モデル27を更新し、簡易な計算に用いる代理モデル27の精度を向上できる。
(2)環境パラメータ22には、所定の作業を実行する速度、すなわちピッキング速度の情報が含まれる。評価シナリオ生成部43は、環境パラメータ22を変動させる範囲が記載された想定変動範囲23に基づき、評価シナリオを生成する。
(変形例1)
 上述した第1の実施の形態では、演算装置1は1つのハードウエア装置として説明した。しかし演算装置1は複数のハードウエアから構成されてもよく、各機能が異なるコンピュータにより実現されてもよい。この場合には、演算装置1の機能はネットワークにより接続され物理的に離れた場所に存在する複数のハードウエアにより実現されてもよい。
―第2の実施の形態―
 図13~図14を参照して、演算装置の第2の実施の形態を説明する。以下の説明では、第1の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第1の実施の形態と同じである。本実施の形態では、主に、計算中に環境パラメータが大きく変動すると計算をやり直す点で第1の実施の形態と異なる。
 図13は、第2の実施の形態における演算装置1Aの構成図である。演算装置1Aは、第1の実施の形態における構成に加えて、外乱評価部45をさらに備える。外乱評価部45は、計画案生成部44の動作開始時における環境パラメータ22と、現在の環境パラメータ22との乖離を評価する。
 図14は、第2の実施の形態における演算装置1Aの処理の概要を示すフローチャートである。第1の実施の形態における図9との相違点は、ステップS34とS35との間にステップS39が追加された点である。ステップS39では外乱評価部45は、ステップS33の最初、すなわち図11のステップS331において取得した環境パラメータ22の値と、最新の環境パラメータ22の値とを比較し、環境パラメータ22の値がステップS33の実行時から大きく変動したか否かを判断する。外乱評価部45は、大きく変動したと判断する場合はステップS33に戻り、大きくは変動していないと判断する場合はステップS35に進む。環境パラメータ22の変動が大きいか否かを判断する基準は、詳細パラメータごとに別途個別に定められてもよいし、想定変動範囲23の値を用いてもよい。
 上述した第2の実施の形態によれば、次の作用効果が得られる。
(3)評価シナリオ生成部43は、最新の環境パラメータ22である開始時環境パラメータに基づき評価シナリオを生成する。計画案生成部44は、評価シナリオを用いた暫定作業計画の算出が完了した際の環境パラメータ22である完了時環境パラメータと、開始時環境パラメータとの差が所定の閾値以上である場合には、最新の環境パラメータ22を用いて評価シナリオ生成部43に評価シナリオを作成させ、再び暫定作業計画を算出する。そのため、環境パラメータ22は短い時間で変動するため完全に一致する環境パラメータ22の値を用いた計算は不可能であるが、計画案生成部44が計画案を生成している最中に環境パラメータ22が大きく変動した場合には改めて計画案を生成するので、実際とは乖離が小さい環境パラメータ22を用いた計画案が生成できる。
(第2の実施の形態の変形例)
 計算開始からの経過時間が所定の閾値を超えた場合に暫定作業計画の算出をやり直してもよい。たとえば図14のステップS39においてさらに、ステップS33の処理を開始してからの経過時間が所定の時間を超えた場合に肯定判断してステップS33に戻るように変更してもよい。またステップS35の直後において、ステップS33の処理を開始してからの経過時間が所定の時間を超えた場合に、ステップS33に戻る分岐を追加してもよい。
―第3の実施の形態―
 図15~図19を参照して、演算装置の第3の実施の形態を説明する。以下の説明では、第1の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第1の実施の形態と同じである。本実施の形態では、主に、複数の代理モデルを使い分ける点で、第1の実施の形態と異なる。
 図15は、第3の実施の形態における演算装置1Bの構成図である。演算装置1Aは、第1の実施の形態における構成に加えて、記憶部13にパラメータ区分28がさらに格納される。また、記憶部13には学習データ25および代理モデル情報26の代わりに学習データ25Aおよび代理モデル情報26Aが格納される。
 代理モデル27は厳密評価部51に比べると計算量が少ない利点を有するが、環境パラメータ22の値が変化すると計算の精度が低下する傾向にある。そのため、予め複数の代理モデル27を生成しておき環境パラメータ22の値に応じてそれらの代理モデル27を使い分ける。本実施の形態では、環境パラメータ22の値を予め複数の区分に分け、区分ごとにデータセットを形成する。そしてこのデータセットごとに代理モデルを生成する。記憶部13には、環境パラメータ22の区分を示す情報がパラメータ区分28として保存される。本実施の形態では、代理モデル27が複数生成されるので、これら複数の代理モデル27を生成するための学習データ25Aおよび代理モデル情報26Aも第1の実施の形態と異なる。
 図16は、パラメータ区分28の一例を示す図である。パラメータ区分28には、データセットIDと環境パラメータ22の値の範囲との対応関係が示されている。たとえばデータセットID「DS001」に対応する環境パラメータ22の値の範囲は、AGV台数が「8~12台」、ピッキング速度が「80~120個/時」である。次に示すデータセットID「DS002」に対応する環境パラメータ22の値の範囲は、ピッキング速度は同一であるが、AGV台数が「13~20台」である点が1つ目のデータセットと異なる。なお、データセット同士の環境パラメータ22の値は完全に一致がなければよく、値の範囲に重複があってもよい。
 図17は、本実施の形態における学習データ25Aの一例を示す図である。第1の実施の形態における学習データ25との相違点は、データセットIDの情報が追加されている点である。図17に示す例では、環境パラメータ22が同一の区分に含まれる2つのサンプルIDのデータが示されている。
 図18は、本実施の形態における代理モデル情報26Aの一例を示す図である。第1の実施の形態における代理モデル情報26との相違点は、代理モデルの識別子である代理モデルID、およびその代理モデルの生成に使用されたデータセットを示すデータセットIDが追加されている点である。
 図19は、第3の実施の形態における演算装置1Bの処理の概要を示すフローチャートである。第1の実施の形態における図9との相違点は、ステップS33とS34との間にステップS391が追加された点である。ステップS391では計画案生成部44は、最適な代理モデル27を選択肢、ステップS34以降ではその代理モデル27を用いる。
 本ステップにおける計画案生成部44の具体的な処理は次のとおりである。まず計画案生成部44は、現在の環境パラメータ22の値を読み取り、パラメータ区分28において現在の環境パラメータ22の値が含まれる範囲に対応するデータセットIDを特定する。そして計画案生成部44は、代理モデル情報26Aを参照して特定したデータセットIDに対応する代理モデル27の内部パラメータの値を読み取り、代理モデル27を使用する。
 上述した第3の実施の形態によれば、次の作用効果が得られる。
(CL4)評価シナリオ生成部43は、環境パラメータの値の範囲が異なる評価シナリオを複数生成する。代理モデル生成部41は、評価シナリオのそれぞれに対応する代理モデル27を生成し、計画案生成部44は、環境パラメータ22の値に応じていずれかの代理モデル27を選択する。そのため、状況にあわせて代理モデル27を選択することで、計算の精度を向上することができる。
(第3の実施の形態の変形例)
 第2の実施の形態における構成と、第3の実施の形態における構成とを組み合わせてもよい。この場合には、計画案生成部44が最適な代理モデル27を用いて演算を行う利点、および計画案生成部44の処理中に環境パラメータ22が大きく変動した場合には再計算を行える利点がある。なおこの場合には、ステップS39における判断にパラメータ区分28を用いることができる。
 図20は、本変形例における演算装置1Bの処理の概要を示すフローチャートである。ただし図20では、作図の都合により開始からステップS31までの記載を省略している。本フローチャートを第1の実施の形態における図9と比較すると、ステップS33とステップS34との間にステップS391が追加され、さらにステップS34とステップS35との間にステップS39が追加されている。
 上述した各実施の形態および変形例において、機能ブロックの構成は一例に過ぎない。別々の機能ブロックとして示したいくつかの機能構成を一体に構成してもよいし、1つの機能ブロック図で表した構成を2以上の機能に分割してもよい。また各機能ブロックが有する機能の一部を他の機能ブロックが備える構成としてもよい。
 上述した各実施の形態および変形例において、プログラムはROM12に格納されるとしたが、プログラムは記憶部13に格納されていてもよい。また、演算装置1が不図示の入出力インタフェースを備え、必要なときに入出力インタフェースと演算装置1が利用可能な媒体を介して、他の装置からプログラムが読み込まれてもよい。ここで媒体とは、例えば入出力インタフェースに着脱可能な記憶媒体、または通信媒体、すなわち有線、無線、光などのネットワーク、または当該ネットワークを伝搬する搬送波やディジタル信号、を指す。また、プログラムにより実現される機能の一部または全部がハードウエア回路やFPGAにより実現されてもよい。
 上述した各実施の形態および変形例は、それぞれ組み合わせてもよい。上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。
1、1A、1B…演算装置
13…記憶部
14…メモリ
21…作業指示
22…環境パラメータ
23…想定変動範囲
24…許容予測誤差
25、25A…学習データ
26、26A…代理モデル情報
27…代理モデル
28…パラメータ区分
41…代理モデル生成部
42…代理モデル更新部
43…評価シナリオ生成部
44…計画案生成部
45…外乱評価部
51…厳密評価部
52…簡易評価部

Claims (6)

  1.  変動する環境に関する情報を環境パラメータとして表現可能な環境において、所定の作業に関する作業計画を作成する演算装置であって、
     前記所定の作業に関する所要時間を算出する厳密評価部と、
     最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成部と、
     学習データを用いて、前記厳密評価部よりも簡易に前記所定の作業に関する所要時間を算出するための代理モデルを作成する代理モデル生成部と、
     前記代理モデルを用いて前記所要時間を算出し、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成部と、
     前記厳密評価部を用いて算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新部とを備える、演算装置。
  2.  請求項1に記載の演算装置において、
     前記環境パラメータには、前記所定の作業を実行する速度の情報が含まれ、
     前記評価シナリオ生成部は、前記環境パラメータを変動させる範囲が記載された環境パラメータ変動情報に基づき、前記評価シナリオを生成する、演算装置。
  3.  請求項1に記載の演算装置において、
     前記評価シナリオ生成部は、最新の前記環境パラメータである開始時環境パラメータに基づき前記評価シナリオを生成し、
     前記計画案生成部は、前記評価シナリオを用いた前記暫定作業計画の算出が完了した際の前記環境パラメータである完了時環境パラメータと、前記開始時環境パラメータとの差が所定の閾値以上である場合には、最新の前記環境パラメータを用いて前記評価シナリオ生成部に前記評価シナリオを作成させ、再度前記暫定作業計画を算出する、演算装置。
  4.  請求項1に記載の演算装置において、
     前記評価シナリオ生成部は、前記環境パラメータの値の範囲が異なる前記評価シナリオを複数生成し、
     前記代理モデル生成部は、前記評価シナリオのそれぞれに対応する前記代理モデルを生成し、
     前記計画案生成部は、前記環境パラメータの値に応じていずれかの前記代理モデルを選択する、演算装置。
  5.  変動する環境に関する情報を環境パラメータとして表現可能な環境を対象として、所定の作業に関する作業計画を演算装置が作成する、作業計画の作成方法であって、
     前記所定の作業に関する所要時間を算出する厳密評価処理と、
     最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成処理と、
     学習データを用いて、前記厳密評価処理よりも簡易に前記所定の作業に関する演算を行うための代理モデルを作成する代理モデル生成処理と、
     前記代理モデルを用いて前記所定の作業に関する演算を行い、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成処理と、
     前記厳密評価処理により算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新処理とを含む、作業計画の作成方法。
  6.  変動する環境に関する情報を環境パラメータとして表現可能な環境において、所定の作業に関する作業計画を作成する演算システムであって、
     前記所定の作業に関する所要時間を算出する厳密評価部と、
     最新の前記環境パラメータに基づき複数の前記環境パラメータを評価シナリオとして生成する評価シナリオ生成部と、
     学習データを用いて、前記厳密評価部よりも簡易に前記所定の作業に関する演算を行うための代理モデルを作成する代理モデル生成部と、
     前記代理モデルを用いて前記所定の作業に関する演算を行い、前記複数の環境パラメータのいずれにも適する前記作業計画である暫定作業計画を算出する計画案生成部と、
     前記厳密評価部を用いて算出された時間であり、前記暫定作業計画における前記所定の作業に要する所要時間である厳密所要時間と、前記代理モデルを用いて算出された時間であり前記暫定作業計画における前記所定の作業に要する所要時間である代理所要時間との差が所定の閾値以上の場合に、前記暫定作業計画および前記厳密所要時間を用いて前記代理モデルを更新する、代理モデル更新部とを備える、演算システム。
     
PCT/JP2022/039107 2021-11-04 2022-10-20 演算装置、作業計画の作成方法、演算システム WO2023079971A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021180048A JP2023068756A (ja) 2021-11-04 2021-11-04 演算装置、作業計画の作成方法、演算システム
JP2021-180048 2021-11-04

Publications (1)

Publication Number Publication Date
WO2023079971A1 true WO2023079971A1 (ja) 2023-05-11

Family

ID=86240995

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/039107 WO2023079971A1 (ja) 2021-11-04 2022-10-20 演算装置、作業計画の作成方法、演算システム

Country Status (2)

Country Link
JP (1) JP2023068756A (ja)
WO (1) WO2023079971A1 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017116984A (ja) * 2015-12-21 2017-06-29 株式会社日立製作所 計画調整システムおよび計画調整方法
WO2019116985A1 (ja) * 2017-12-13 2019-06-20 日立オートモティブシステムズ株式会社 演算システム、サーバ、車載装置
JP2019220048A (ja) * 2018-06-22 2019-12-26 株式会社日立製作所 交通流予測装置及び交通流予測システム
US20200258263A1 (en) * 2017-12-30 2020-08-13 Intel Corporation Policy-based system interface for a real-time autonomous system
JP2021022016A (ja) * 2019-07-24 2021-02-18 株式会社日立製作所 出荷作業支援システム、その方法、及びコンピュータプログラム
JP2021105951A (ja) * 2019-12-27 2021-07-26 日本電気株式会社 画像分析装置、画像分析方法及びコンピュータプログラム
WO2021186591A1 (ja) * 2020-03-17 2021-09-23 三菱電機株式会社 配置計画装置、配置計画方法及び配置計画プログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017116984A (ja) * 2015-12-21 2017-06-29 株式会社日立製作所 計画調整システムおよび計画調整方法
WO2019116985A1 (ja) * 2017-12-13 2019-06-20 日立オートモティブシステムズ株式会社 演算システム、サーバ、車載装置
US20200258263A1 (en) * 2017-12-30 2020-08-13 Intel Corporation Policy-based system interface for a real-time autonomous system
JP2019220048A (ja) * 2018-06-22 2019-12-26 株式会社日立製作所 交通流予測装置及び交通流予測システム
JP2021022016A (ja) * 2019-07-24 2021-02-18 株式会社日立製作所 出荷作業支援システム、その方法、及びコンピュータプログラム
JP2021105951A (ja) * 2019-12-27 2021-07-26 日本電気株式会社 画像分析装置、画像分析方法及びコンピュータプログラム
WO2021186591A1 (ja) * 2020-03-17 2021-09-23 三菱電機株式会社 配置計画装置、配置計画方法及び配置計画プログラム

Also Published As

Publication number Publication date
JP2023068756A (ja) 2023-05-18

Similar Documents

Publication Publication Date Title
US20170308052A1 (en) Cell controller for optimizing motion of production system including industrial machines
US20170004406A1 (en) Parallel belief space motion planner
Edelkamp et al. Monte-Carlo tree search for logistics
US20190228360A1 (en) Production schedule creating apparatus, production schedule creating method, and production schedule creating program
JP2019200792A (ja) マルチエージェントシステムにおけるロボットの動作方法、ロボット及びマルチエージェントシステム
JP2020173551A (ja) 故障予測装置、故障予測方法、コンピュータプログラム、計算モデルの学習方法および計算モデルの生成方法
JP6990563B2 (ja) 製品設計および工程設計装置
CN106933105A (zh) 受限条件下的轨迹更新综合预测迭代学习控制算法
CN110609494A (zh) 基于asrv多台四向穿梭车在规划路径上防拥堵仿真控制方法及***
US6633858B2 (en) Problem solver uses learning a cognitive distance to attain a goal state
Roemer et al. Models for concurrent product and process design
WO2023079971A1 (ja) 演算装置、作業計画の作成方法、演算システム
Kallat et al. Automatic building of a repository for component-based synthesis of warehouse simulation models
KR102494187B1 (ko) 위치 결정 제어 장치 및 위치 결정 방법
CN116512237B (zh) 工业机器人视觉伺服方法、装置、电子设备及存储介质
WO2020054345A1 (ja) 電子制御装置、ニューラルネットワーク更新システム
CN116414094A (zh) 一种焊接装配智能调度方法及***
Djeumou et al. Task-guided inverse reinforcement learning under partial information
Edwards et al. Coverage planning for capacitated field operations under spatial variability
WO2022004881A1 (ja) システム最適制御装置、システム最適制御方法及びプログラム
JP7420236B2 (ja) 学習装置、学習方法および学習プログラム
JPH05108649A (ja) 生産・物流スケジユール作成装置
Rivas et al. Auction model for transport order assignment in AGV systems
CN111667130B (zh) 方案验证方法、装置及设备
JPH11328259A (ja) ペトリネットによるモデル化方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22889791

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE