JP6872226B2 - Decision maker - Google Patents
Decision maker Download PDFInfo
- Publication number
- JP6872226B2 JP6872226B2 JP2017016294A JP2017016294A JP6872226B2 JP 6872226 B2 JP6872226 B2 JP 6872226B2 JP 2017016294 A JP2017016294 A JP 2017016294A JP 2017016294 A JP2017016294 A JP 2017016294A JP 6872226 B2 JP6872226 B2 JP 6872226B2
- Authority
- JP
- Japan
- Prior art keywords
- decision
- electrolyte
- making apparatus
- electrodes
- making
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003792 electrolyte Substances 0.000 claims description 68
- 230000009471 action Effects 0.000 claims description 48
- 150000002500 ions Chemical class 0.000 claims description 24
- 239000002001 electrolyte material Substances 0.000 claims description 23
- 229910052751 metal Inorganic materials 0.000 claims description 11
- 239000002184 metal Substances 0.000 claims description 11
- 239000004065 semiconductor Substances 0.000 claims description 10
- 230000005684 electric field Effects 0.000 claims description 8
- -1 tetrafluoroborate ion Chemical class 0.000 claims description 8
- 230000006399 behavior Effects 0.000 claims description 7
- 239000011244 liquid electrolyte Substances 0.000 claims description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 6
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 6
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 6
- 229910044991 metal oxide Inorganic materials 0.000 claims description 6
- 150000004706 metal oxides Chemical class 0.000 claims description 6
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 claims description 6
- 229920000642 polymer Polymers 0.000 claims description 6
- 239000000463 material Substances 0.000 claims description 5
- 239000007784 solid electrolyte Substances 0.000 claims description 4
- 125000004200 2-methoxyethyl group Chemical group [H]C([H])([H])OC([H])([H])C([H])([H])* 0.000 claims description 3
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 3
- 229920003171 Poly (ethylene oxide) Polymers 0.000 claims description 3
- 229910004298 SiO 2 Inorganic materials 0.000 claims description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 claims description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 claims description 3
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 claims description 3
- 239000013543 active substance Substances 0.000 claims description 3
- 229910052782 aluminium Inorganic materials 0.000 claims description 3
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 claims description 3
- 229910002090 carbon oxide Inorganic materials 0.000 claims description 3
- 229910000420 cerium oxide Inorganic materials 0.000 claims description 3
- 229910052802 copper Inorganic materials 0.000 claims description 3
- 239000010949 copper Substances 0.000 claims description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 229910052737 gold Inorganic materials 0.000 claims description 3
- 239000010931 gold Substances 0.000 claims description 3
- 229910052742 iron Inorganic materials 0.000 claims description 3
- 229910000625 lithium cobalt oxide Inorganic materials 0.000 claims description 3
- BFZPBUKRYWOWDV-UHFFFAOYSA-N lithium;oxido(oxo)cobalt Chemical compound [Li+].[O-][Co]=O BFZPBUKRYWOWDV-UHFFFAOYSA-N 0.000 claims description 3
- URLJKFSTXLNXLG-UHFFFAOYSA-N niobium(5+);oxygen(2-) Chemical compound [O-2].[O-2].[O-2].[O-2].[O-2].[Nb+5].[Nb+5] URLJKFSTXLNXLG-UHFFFAOYSA-N 0.000 claims description 3
- BMMGVYCKOGBVEV-UHFFFAOYSA-N oxo(oxoceriooxy)cerium Chemical compound [Ce]=O.O=[Ce]=O BMMGVYCKOGBVEV-UHFFFAOYSA-N 0.000 claims description 3
- BPUBBGLMJRNUCC-UHFFFAOYSA-N oxygen(2-);tantalum(5+) Chemical compound [O-2].[O-2].[O-2].[O-2].[O-2].[Ta+5].[Ta+5] BPUBBGLMJRNUCC-UHFFFAOYSA-N 0.000 claims description 3
- 229910052763 palladium Inorganic materials 0.000 claims description 3
- 229910052697 platinum Inorganic materials 0.000 claims description 3
- RMAQACBXLXPBSY-UHFFFAOYSA-N silicic acid Chemical compound O[Si](O)(O)O RMAQACBXLXPBSY-UHFFFAOYSA-N 0.000 claims description 3
- 239000010703 silicon Substances 0.000 claims description 3
- 235000012239 silicon dioxide Nutrition 0.000 claims description 3
- 229910052814 silicon oxide Inorganic materials 0.000 claims description 3
- 229910052709 silver Inorganic materials 0.000 claims description 3
- 239000004332 silver Substances 0.000 claims description 3
- 229910052715 tantalum Inorganic materials 0.000 claims description 3
- GUVRBAGPIYLISA-UHFFFAOYSA-N tantalum atom Chemical compound [Ta] GUVRBAGPIYLISA-UHFFFAOYSA-N 0.000 claims description 3
- DZLFLBLQUQXARW-UHFFFAOYSA-N tetrabutylammonium Chemical compound CCCC[N+](CCCC)(CCCC)CCCC DZLFLBLQUQXARW-UHFFFAOYSA-N 0.000 claims description 3
- CBXCPBUEXACCNR-UHFFFAOYSA-N tetraethylammonium Chemical compound CC[N+](CC)(CC)CC CBXCPBUEXACCNR-UHFFFAOYSA-N 0.000 claims description 3
- QEMXHQIAXOOASZ-UHFFFAOYSA-N tetramethylammonium Chemical compound C[N+](C)(C)C QEMXHQIAXOOASZ-UHFFFAOYSA-N 0.000 claims description 3
- 229910052719 titanium Inorganic materials 0.000 claims description 3
- 239000010936 titanium Substances 0.000 claims description 3
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 claims description 3
- 229910052721 tungsten Inorganic materials 0.000 claims description 3
- 239000010937 tungsten Substances 0.000 claims description 3
- ZNOKGRXACCSDPY-UHFFFAOYSA-N tungsten trioxide Chemical compound O=[W](=O)=O ZNOKGRXACCSDPY-UHFFFAOYSA-N 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 2
- FUJCRWPEOMXPAD-UHFFFAOYSA-N lithium oxide Chemical compound [Li+].[Li+].[O-2] FUJCRWPEOMXPAD-UHFFFAOYSA-N 0.000 claims description 2
- 229910001947 lithium oxide Inorganic materials 0.000 claims description 2
- RVTZCBVAJQQJTK-UHFFFAOYSA-N oxygen(2-);zirconium(4+) Chemical compound [O-2].[O-2].[Zr+4] RVTZCBVAJQQJTK-UHFFFAOYSA-N 0.000 claims description 2
- PBCFLUZVCVVTBY-UHFFFAOYSA-N tantalum pentoxide Inorganic materials O=[Ta](=O)O[Ta](=O)=O PBCFLUZVCVVTBY-UHFFFAOYSA-N 0.000 claims description 2
- 229910001928 zirconium oxide Inorganic materials 0.000 claims description 2
- 238000000034 method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 230000002787 reinforcement Effects 0.000 description 8
- 150000001450 anions Chemical class 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 5
- 239000003990 capacitor Substances 0.000 description 4
- 150000001768 cations Chemical class 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229910052698 phosphorus Inorganic materials 0.000 description 4
- 229910002804 graphite Inorganic materials 0.000 description 3
- 239000010439 graphite Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 230000037427 ion transport Effects 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 229920000557 Nafion® Polymers 0.000 description 1
- QCWXUUIWCKQGHC-UHFFFAOYSA-N Zirconium Chemical compound [Zr] QCWXUUIWCKQGHC-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- XUCJHNOBJLKZNU-UHFFFAOYSA-M dilithium;hydroxide Chemical compound [Li+].[Li+].[OH-] XUCJHNOBJLKZNU-UHFFFAOYSA-M 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000003487 electrochemical reaction Methods 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000002113 nanodiamond Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 229910052726 zirconium Inorganic materials 0.000 description 1
Images
Description
本発明は、事象情報を電気信号にして与えときに報酬確率の高い行動を選択する意思決定装置に関する。 The present invention relates to a decision-making device that selects an action having a high reward probability when event information is given as an electric signal.
近年、高効率な意思決定の重要性が増している。例えば、金融においては、刻一刻と変動する相場情報を基に安全に危険資産の管理を行う必要がある。コグニティブ無線では、端末の位置や時間帯によって最適な無線方式、周波数帯を選択する必要がある。囲碁、将棋といった競技は変動する環境で意思決定が問題となる典型例であり、近年、人間とコンピュータとの対戦が話題となっている。 In recent years, the importance of highly efficient decision making has increased. For example, in finance, it is necessary to safely manage dangerous assets based on market information that fluctuates from moment to moment. In cognitive radio, it is necessary to select the optimum radio method and frequency band according to the position and time zone of the terminal. Competitions such as Go and Shogi are typical examples where decision-making becomes a problem in a fluctuating environment, and in recent years, competition between humans and computers has become a hot topic.
こうした問題は、多本腕バンディット問題として取り扱われ、通常、SOFTMAX法やε−GREEDY法といった従来型アルゴリズムを用いた計算処理により解決される。しかし、このような手法は万能ではなく、より高速かつ正確な解法が求められている。
近年、こうした多本腕バンディット問題の効率的な解法として「綱引き原理」が提案された(非特許文献1から3、及び特許文献1)。例えば、報酬確率の異なる2つの行動を選択する場合、それぞれの行動に対する試行錯誤において得られる報酬に応じて変位(綱引き)する物体を用いることによって、より報酬確率の高い行動を選択する。これを意思決定と呼ぶ。
図1を参照しながら報酬確率80%の行動Aと20%の行動Bの2つの行動を選択する場合を考える。行動AとBの報酬確率はプレイヤーにとって未知であるため、それぞれの行動を選択し報酬を得る、あるいは得られないという経験を基に報酬確率を予測し、より報酬確率の高い行動を選択(意思決定)する。綱引き原理では、プレイヤーが行動AやBを選択し、得た報酬に応じて物体を刻一刻と変位させていくことによって、より報酬確率の高い行動を選択(意思決定)する。例えば、試行錯誤の過程で行動Aを選択し、報酬を得た場合は+1、報酬を得られなかった場合は‐ωの変位を物体に与える。逆に行動Bを選択し、報酬を得た場合は‐1、報酬を得られなかった場合は+ωの変位を物体に与える。物体の変位がどちらかに偏ることにより、選択(意思決定)をしたと見做せばよい。ここで、ωはγ/2‐γで定義される。図1の場合、γは行動Aの報酬確率(80%)と行動Bの報酬確率(20%)の和を100で割った値である1.0となる(非特許文献1)。
These problems are treated as multi-armed bandit problems and are usually solved by computational processing using conventional algorithms such as the SOFTMAX method and the ε-GREEDY method. However, such a method is not universal, and a faster and more accurate solution is required.
In recent years, the "tug-of-war principle" has been proposed as an efficient solution to such a multi-armed bandit problem (Non-Patent
Consider a case where two actions, an action A having a reward probability of 80% and an action B having a reward probability of 20%, are selected with reference to FIG. Since the reward probabilities of actions A and B are unknown to the player, the reward probabilities are predicted based on the experience of selecting each action and getting or not getting the reward, and the action with the higher reward probability is selected (intention). decide. In the tug-of-war principle, the player selects actions A and B, and the object is displaced every moment according to the reward obtained, so that the action with a higher reward probability is selected (decision-making). For example, in the process of trial and error, action A is selected, and if a reward is obtained, a displacement of +1 is given to the object, and if no reward is obtained, a displacement of -ω is given to the object. Conversely, if action B is selected and a reward is obtained, a displacement of -1 is given to the object, and if no reward is obtained, a displacement of + ω is given to the object. It can be considered that the choice (decision-making) is made by the displacement of the object being biased to either side. Here, ω is defined by γ / 2-γ. In the case of FIG. 1, γ is 1.0, which is the sum of the reward probability of action A (80%) and the reward probability of action B (20%) divided by 100 (Non-Patent Document 1).
綱引き原理は、従来手法と比較すると報酬確率の高い行動への収束が高速であるだけでなく、環境(それぞれの行動が持つ報酬確率)の変化に対して適応性が高いという利点を有している。さらに、他の解法が計算処理に依拠するプログラムであることに対して、綱引き原理は物理現象に依拠するため、プログラムにおいて問題となる計算処理量の増大とそれに伴って生じる処理数の限界を回避することが可能となる。 The tug-of-war principle has the advantage that it not only converges to actions with a high reward probability faster than the conventional method, but also has high adaptability to changes in the environment (reward probability of each action). There is. Furthermore, since the tug-of-war principle relies on physical phenomena, while other solutions are programs that rely on computational processing, the increase in the amount of computational processing that becomes a problem in programs and the limit on the number of processes that accompanies it are avoided. It becomes possible to do.
綱引き原理を用いた意思決定手段を様々な物理現象を利用して実装して、強化学習に用いる試みがなされている(非特許文献4から7)。例えば、ナノダイヤモンドの窒素欠陥を光子源として用いると、単一光子の粒子性と確率性を利用することで綱引き原理を物理的に実装することが出来る(非特許文献6)。しかし、このような方法では大規模な光学回路が必要となるため、デバイス、回路の小型化には適さないという課題が残る。また、比較的小さな空間で金属フィラメントの生成・切断を行い意思決定に用いようとする試みもある(非特許文献7)。しかしながらこの方法は、綱引き原理を原理上精度良く再現出来ないという根本的な問題を内包しており、実用的とは言い難い。このように、綱引き原理に正確に基づき、かつ小型化可能なデバイスによって意思決定するという意思決定装置の課題は解決されていない。
Attempts have been made to implement decision-making means using the tug-of-war principle using various physical phenomena and use them for reinforcement learning (Non-Patent
本発明の課題は、簡易で小型化可能なデバイスにより、綱引き原理に正確に基づいて意思決定が可能な意思決定装置を提供することである。 An object of the present invention is to provide a decision-making device capable of making a decision based on a tug-of-war principle by a simple and miniaturized device.
本発明の構成を下記に示す。
(構成1)
電荷の蓄積により学習を行う学習手段、報酬確率の異なる行動の中から選択した行動に応じた電荷を前記学習手段に与える電荷供給手段、及び前記学習手段の電圧を読み取る電圧読み取り手段を有し、前記電圧読み取り手段で読み取った電圧により報酬確率の異なる行動の中から選択する行動を決定する意思決定装置であって、
前記学習手段は、電場によるイオンの輸送が可能な電解質材料層を同一の材料からなる2以上の電極で挟んだ電解質素子からなる、意思決定装置。
(構成2)
前記2以上の電極間に前記電荷の流入による電流を流して前記イオンを輸送し、前記電極間に電圧を生じさせる、構成1記載の意思決定装置。
(構成3)
前記イオンの前記2以上の電極のうちの少なくとも1の電極側への移動または電極内への侵入により、前記2以上の電極に電子及び正孔が生成されて電圧が発生する、構成1または2記載の意思決定装置。
(構成4)
前記電解質材料層は液体電解質または固体電解質を含む、構成1から3の何れか1に記載の意思決定装置。
(構成5)
前記液体電解質は、テトラメチルアンモニウムイオン(TMA+)、テトラエチルアンモニウムイオン(TEA+)、テトラブチルアンモニウムイオン(TBA+)、テトラフルオロホウ酸イオン(BF4 −)、N,N−ジエチル−N−メチル−N−(2−メトキシエチル)アンモニウム−ビス(トリフルオロメタンスルホニル)イミド(DEME−TFSI)、N,N−ジエチル−N−メチル−N−(2−メトキシエチル)アンモニウム−テトラフルオロボラート(DEME−BF4)からなる群の少なくとも1を含む、構成4記載の意思決定装置。
(構成6)
前記電解質材料は可動イオンを有する高分子化合物を含む構成4に記載の意思決定装置。
(構成7)
前記高分子化合物はポリエチレンオキシドまたはナフィオンの少なくとも何れかを含む、構成6に記載の意思決定装置。
(構成8)
前記電解質材料層は可動イオンを有する金属酸化物またはケイ酸(SiO2) の少なくとも何れかを含む、構成4に記載の意思決定装置。
(構成9)
前記金属酸化物は、酸化セリウム(CeO2)、酸化タンタル(Ta2O5)、酸化ジルコニウム(ZrO2)、酸化ニオブ(Nb2O5)、酸化タングステン(WO3)、酸化リチウム(Li2O)からなる群の少なくとも1を含む、構成8に記載の意思決定装置。
(構成10)
前記2以上の電極は電子伝導性を有する金属または半導体の少なくとも何れかを含む、構成4に記載の意思決定装置。
(構成11)
前記金属は、金、白金、銀、パラジウム、アルミニウム、鉄、銅、タングステン、チタン、タンタルからなる群の少なくとも1を含む、構成10に記載の意思決定装置。
(構成12)
前記半導体は、炭素、シリコン、コバルト酸リチウムからなる群の少なくとも1を含む、構成10に記載の意思決定装置。
(構成13)
前記金属及び半導体は、電場下でイオンとの化学反応が可能な活性物質を含む、構成10に記載の意思決定装置。
(構成14)
前記金属及び半導体は、電場下でイオン輸送が可能な電解質を含み、前記電解質材料層内及び前記2以上の電極のうちの一方の電極内のイオンが移動して他方の電極内に前記イオンが侵入する、構成10に記載の意思決定装置。
(構成15)
前記意思決定装置は配線切替手段を有する、構成1から14の何れかに記載の意思決定装置。
The configuration of the present invention is shown below.
(Structure 1)
A learning means for learning by the accumulation of charge, charge supply means for providing a charge corresponding to actions selected from among different actions of reward probability to said learning means, and the voltage reading means for reading the voltage of said learning means , a decision device for determining an action to choose from different behavior of the voltage by Ri reward probability voltage read by the reading means,
The learning means is a decision-making device including an electrolyte element in which an electrolyte material layer capable of transporting ions by an electric field is sandwiched between two or more electrodes made of the same material.
(Structure 2)
The decision-making apparatus according to
(Structure 3)
(Structure 4)
The decision-making apparatus according to any one of
(Structure 5)
The liquid electrolyte, tetramethylammonium ion (TMA +), tetraethylammonium ion (TEA +), tetrabutyl ammonium ion (TBA +), tetrafluoroborate ion (BF 4 -), N, N- diethyl--N- Methyl-N- (2-methoxyethyl) ammonium-bis (trifluoromethanesulfonyl) imide (DEME-TFSI), N, N-diethyl-N-methyl-N- (2-methoxyethyl) ammonium-tetrafluoroborate ( The decision-making apparatus according to
(Structure 6)
The decision-making apparatus according to
(Structure 7)
The decision-making apparatus according to
(Structure 8)
The decision-making apparatus according to
(Structure 9)
The metal oxides include cerium oxide (CeO 2 ), tantalum pentoxide (Ta 2 O 5 ), zirconium oxide (ZrO 2 ), niobium oxide (Nb 2 O 5 ), tungsten oxide (WO 3 ), and lithium oxide (
(Structure 10)
The decision-making apparatus according to
(Structure 11)
10. The decision-making apparatus according to
(Structure 12)
The decision-making apparatus according to
(Structure 13)
The decision-making apparatus according to
(Structure 14)
The metal and the semiconductor include an electrolyte capable of transporting ions under an electric field, and ions in the electrolyte material layer and in one of the two or more electrodes move to move the ions into the other electrode. The decision-making apparatus according to
(Structure 15)
The decision-making device according to any one of
本発明によれば、簡易で小型化可能なデバイスにより、綱引き原理に正確に基づいて意思決定が可能な意思決定装置を提供することが可能になる。 According to the present invention, it is possible to provide a decision-making device capable of making a decision based on a tug-of-war principle by a simple and miniaturized device.
以下本発明を実施するための形態を図面を参照しながら説明する。
(実施の形態1)
<意思決定装置の構成>
本発明の意思決定装置は、電荷の蓄積により学習を行う学習手段、事象の行動に応じた電荷を学習手段に与える電荷供給手段、及び学習手段の電圧を読み取る電圧読み取り手段からなり、その構成を図2に示す。
ここで、電荷の蓄積により学習を行う学習手段は、電場によるイオン輸送が可能な電解質材料層を2以上の電極で挟んだ電解質素子11からなる。
電荷供給手段は、事象の行動の学習をさせるための入力信号を基に電源から電荷を供給する電源スイッチからなり、電圧を読み取る手段は電圧計14からなる。電圧計は、この回路を流れる電流に対してなるべく影響を与えないように、高抵抗(高インピーダンス)のものを用いることが好ましい。
電源スイッチは、電源と入力信号により電圧の印加と切断、電圧の正負及びその電圧の大きさの調整を行う機能を有する。図1では、電源スイッチは、電解質素子11に入力信号15を基に第1の電圧を印加及びその切断が可能な第1の電源スイッチ12と、入力信号16を基に第1の電源とは逆向きの電圧を印加及びその切断することが可能な第2の電源スイッチ13からなる場合を示す。但し、これは一例であり、電源スイッチは、1つの電源から入力信号を基に、電解質素子11に正負を含む所定の電圧を印加したり、電圧の印加を中断したりすることが可能なスイッチを有するものでもよい。
Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings.
(Embodiment 1)
<Configuration of decision-making device>
The decision-making apparatus of the present invention comprises a learning means for learning by accumulating electric charges, a charge supplying means for giving charges to the learning means according to the behavior of an event, and a voltage reading means for reading the voltage of the learning means. It is shown in FIG.
Here, the learning means for learning by accumulating electric charges includes an
The charge supply means includes a power switch that supplies charges from a power source based on an input signal for learning the behavior of an event, and a means for reading a voltage includes a
The power switch has a function of applying and disconnecting a voltage, positive and negative of a voltage, and adjusting the magnitude of the voltage by a power supply and an input signal. In FIG. 1, the power supply switch is a first
電源スイッチ12としては、例えば図3に示すように、MOSトランジスタスイッチ21、直流電源22、可変抵抗23からなるものが挙げられる。学習を与えるための入力信号13がMOSトランジスタ21のゲート24に入力されると、MOSトランジスタ21がオンの状態になって、電解質素子11に電圧が印加される。入力信号13が入力されない場合は、MOSトランジスタ21はオフの状態になって電解質素子11へは電圧は印加されない。ここで、電解質素子11に印加される電圧の大きさは可変抵抗23によって所定の値に調整される。
電源スイッチ13としては、例えば図4に示すように、MOSトランジスタスイッチ25、直流電源26、可変抵抗27からなるものが挙げられる。ここで、直流電源26は、直流電源22の電圧の正負とは逆の正負を与える電源にしておく。学習を与えるための入力信号16がMOSトランジスタ25のゲート28に入力されると、MOSトランジスタ25がオンの状態になって、電解質素子11に電源スイッチ12からの電圧とは逆向きの電圧が印加される。入力信号16が入力されない場合は、MOSトランジスタ25はオフの状態になって電解質素子11へは電圧は印加されない。ここで、電源スイッチ12と同様に、電解質素子11に印加される電圧の大きさは可変抵抗27によって所定の値に調整される。
Examples of the
Examples of the
<電解質素子の構造>
実施の形態1では、その構成と機能をわかりやすくすることも考慮して、電極が2つからなる電解質素子11(2端子電解質素子11)の場合について説明する。
電解質素子11の構造を断面図である図5に示す。電解質素子11は、陰イオン1と陽イオン2が移動出来る電解質材料層3を第1の電極4と第2の電極5で挟んだ積層構造になっている。電流印加による効果は、第1の電極4と第2の電極5との間の電圧(起電力)として測定可能である。
<Structure of electrolyte element>
In the first embodiment, the case of the electrolyte element 11 (two-terminal electrolyte element 11) having two electrodes will be described in consideration of making the configuration and the function easy to understand.
The structure of the
なお、図5及び以降の概念図は本発明を概念的に示すものであるため、実際の構造がこれらの図に示す構造と完全に相似形となることが必要とされるわけではないし、またこれらの図には明示されていない要素を追加したり、同等な別の要素で置換することもできる。 Since the conceptual diagrams of FIG. 5 and the following are conceptually showing the present invention, it is not necessary that the actual structure is completely similar to the structures shown in these figures. Elements not explicitly shown in these figures can be added or replaced with other equivalent elements.
電解質材料層3の材料としては、例えば、液体電解質であるテトラメチルアンモニウム−テトラフルオロボラート(TMA−BF4)を用いることができる。電解質としては、テトラメチルアンモニウムイオン(TMA+)、テトラエチルアンモニウムイオン(TEA+)、テトラブチルアンモニウムイオン(TBA+)、テトラフルオロホウ酸イオン(BF4 −)、N,N−ジエチル−N−メチル−N−(2−メトキシエチル)アンモニウム−ビス(トリフルオロメタンスルホニル)イミド(DEME−TFSI)、N,N−ジエチル−N−メチル−N−(2−メトキシエチル)アンモニウム−テトラフルオロボラート(DEME−BF4)からなる群の少なくとも1を含む液体電解質を使用することもできる。また、電解質材料には電解質以外に各種の添加物を加えることもできる。また、電解質の材料としては他に固体電解質、可動イオンを含む高分子化合物、可動イオンを有する金属酸化物及びケイ酸(SiO2)も使用可能である。
ここで、可動イオンを含む高分子化合物としては、ポリエチレンオキシド、ナフィオンを挙げることができ、可動イオンを有する金属酸化物としては、酸化セリウム(CeO2)、酸化タンタル(Ta2O5)、酸化ジルコニウム(ZrO2)、酸化ニオブ(Nb2O5)、酸化タングステン(WO3)、酸化リチウム(Li2O)を挙げることができる。
As the material of the
Here, examples of the polymer compound containing mobile ions include polyethylene oxide and naphthion, and examples of the metal oxide having mobile ions include cerium oxide (CeO 2 ), tantalum oxide (Ta 2 O 5 ), and oxidation. Examples thereof include zirconium (ZrO 2 ), niobium oxide (Nb 2 O 5 ), tungsten oxide (WO 3 ), and lithium oxide (Li 2 O).
第1の電極4及び第2の電極5の材料としては、例えば、電解質との化学反応について比較的不活性であるグラファイトを用いることができる。グラファイト以外にも、電子伝導性を有する金属、例えば、金、白金、銀、パラジウム、アルミニウム、鉄、銅、タングステン、チタン、タンタルを用いることができる。また、第1の電極4及び第2の電極5として、電子伝導性を有する半導体、例えば、炭素、シリコン、コバルト酸リチウムを用いることもできる。これらの金属及び半導体は、電場下でイオンとの化学反応が可能な活性物質を含んでいる。
As the material of the
<意思決定装置の動作>
図6と図7を参照しながら、本発明の動的に強化学習可能な意思決定装置の動作を説明する。図6は、図5に示した2端子電解質素子11に対して第2の電極側から電流を流すことによって、第1の電極4と第2の電極5の間の電圧(起電力)を変化させることができることを示している。
<Operation of decision-making device>
The operation of the dynamically reinforcement learning decision-making device of the present invention will be described with reference to FIGS. 6 and 7. FIG. 6 shows that the voltage (electromotive force) between the
図6に示す電解質素子11を作製した段階(原点状態)では、図5に示す様に、電解質材料層3内には陰イオン1と陽イオン2が均一に分布している。次に、電解質素子11の第1の電極4側から電流を流すと、電解質材料層3内の負の電荷を有する陰イオン1は、第1の電極4と電解質材料層3の界面(以下、第1の電極側界面と称する。また、第2の電極5と電解質材料層3との界面を第2の電極側界面と称する。)付近に移動し、場合によっては一部が第1の電極内に侵入して、濃化する。このとき、陰イオン1の濃化により、第1の電極4には正の電荷h+(正の極性の伝導キャリア)が蓄積される。一方、第1の電極と対向する第2の電極5においては、陰イオン1が減少して、正の極性のイオンである陽イオン2が残される。そのため、第2の電極5には負の電荷e−(負の極性の伝導キャリア)が蓄積される。
この状態は平行極板キャパシタに蓄電したのと類似の状態であるので、第1の電極4と第2の電極5との間に、第1の電極4を正の極性とした電圧(Vで表し、第1の電極4側の電圧を印加電圧の極性とする。)が起電力として生じる。ここで、この起電力Vは、流れる電流や電解質材料層3内におけるイオン伝導度、イオン輸率によって変化する。なお、電流を流す時間は数ミリ秒から数秒が好ましい。
At the stage where the
Since this state is similar to the state in which electricity is stored in the parallel electrode plate capacitor, a voltage (at V) between the
本装置で生じた起電力Vは電流により蓄積した電荷によるものなので、電流を停止して回路を開放しても起電力はすぐには失われない。そして、さらに電流を流すことにより、起電力を増減させることが可能である。 Since the electromotive force V generated by this device is due to the electric charge accumulated by the current, the electromotive force is not immediately lost even if the current is stopped and the circuit is opened. Then, the electromotive force can be increased or decreased by further passing an electric current.
次に、図7を用いて強化学習及び意思決定の手順を、報酬確率PA、PB(%)を持つ二つの行動A、Bの選択を行う場合を例に挙げて説明する。意思決定装置100は、結果的に、正の起電力(電圧)を示す場合は行動Aを選択し、PAの確率で報酬を得るとする。逆に100‐PA(%)の確率で報酬は得られない。同様に、負の起電力(電圧)を示す場合は行動Bを選択し、PBの確率で報酬を得るとする。このときは、100‐PB(%)の確率で報酬が得られない。
図7のt1に示す時点で起電力を正と判定すると、行動Aを選択するのでPAの確率で報酬を得るが、装置上では、この報酬に対応する予め定めた値の正の電流を一定時間流しておく。正の電流により、起電力Vは正の極性で増大する(V1に対応)。電流を止めて回路を一定時間開くと、起電力Vの減衰が起こる(V2に対応)。回路を開いた状態でt2の時点で起電力Vを判定した後、t2の時点から再び電流(この場合は上記とは逆向きの電流)を流し、t3の時点で起電力Vを判定する。そして、t3の時点で回路を開き(V4に対応)、同様の過程を繰り返す。図7の時刻t1からt2の過程(図7のT1)を1回の試行とし、この試行を繰り返し行う。試行回数を増すに従い、起電力が正、もしくは負に偏っていく。これを以て装置が行動A、もしくは行動Bを選択したと判断する。例えば、PA>PBであれば、正の起電力に偏っていくとき、意思決定装置100は報酬確率がより高い行動を正しく選択したと解釈される。
Next, reinforcement learning and decision-making procedures, will be described as an example the case of performing compensation probability P A, two actions A with P B (%), the selection of B with reference to FIG.
When determining the electromotive force as positive when shown in t 1 in FIG. 7, to obtain a compensation with a probability of P A so selecting an action A, it is on the device, a positive current of a predetermined value corresponding to the remuneration Let it flow for a certain period of time. The positive current, the electromotive force V is (corresponding to V 1) to increase a positive polarity. Opening a circuit constant time stop current (corresponding to V 2) attenuation occurs electromotive force V. After determining the electromotive force V at t 2 with the circuit open, the current (in this case, the current in the opposite direction to the above) is passed again from the time t 2 , and the electromotive force V is calculated at t 3. judge. Then, (corresponding to V 4) to open the circuit at the time of t 3, it repeats the same process. The process from time t 1 to t 2 in FIG. 7 (T 1 in FIG. 7) is regarded as one trial, and this trial is repeated. As the number of trials increases, the electromotive force becomes positive or negative. Based on this, it is determined that the device has selected action A or action B. For example, if PA > P B , it is interpreted that the decision-making
本発明の意思決定装置100では、事象の行動に応じて電荷を電解質素子11に蓄積させていき、試行を繰り返した結果、最終的に蓄積された電荷による起電力により意思決定を行っている。本発明では、この電荷の蓄積素子として電気化学動作を行う電解質を用いたことが1つの要となっている。
In the decision-making
例えば、電解質素子11に置き換えて、電子を蓄積するコンデンサーを電荷蓄積素子として用いた場合を考える。コンデンサーの場合は、電流印加によって蓄積された電荷をQとすると、報酬確率の変動に対応するために失われなければならない電荷も‐Qになる。コンデンサーの場合はこの関係性が厳密に成立する。意思決定工程を、パチンコを例に例えて言うと、1台のパチンコ台を使って10万円儲けた遊戯者は、その台で10万円以上損をするまでその台を諦められない状態に相当し、賢い意思決定とは言い難い状況になる。
For example, consider a case where a capacitor that stores electrons is used as a charge storage element instead of the
一方、電荷蓄積素子として電解質素子を用いている本発明では、電気化学反応が進行することにより電荷が少しずつ失われていくため、報酬確率の変動に対応するために失われなければならないQはかなり小さくなる。上記のパチンコの例で言うと、10万円儲かった台で例えば3万円損をした段階で見切りをつけて他の台を選択するという判断が可能になり、より賢い意思決定ができる。 On the other hand, in the present invention in which the electrolyte element is used as the charge storage element, the charge is gradually lost as the electrochemical reaction proceeds, so that the Q that must be lost in order to cope with the fluctuation of the reward probability is It will be quite small. In the case of the above pachinko machine, it becomes possible to make a decision to give up and select another pachinko machine when a machine that has earned 100,000 yen has lost 30,000 yen, for example, and a smarter decision-making can be made.
(実施の形態2)
一連の強化学習と意思決定は2つ以上の行動に対しても、対応する電極を適宜増設することによって実施することが可能である。具体的には、上述の起電力の判定基準を、最も高いもしくは低い起電力を示す行動を選択する、と改めればよい。よって、原理上は取り扱うことが出来る行動の数には制限がない。
(Embodiment 2)
A series of reinforcement learning and decision making can be carried out for two or more actions by adding corresponding electrodes as appropriate. Specifically, the above-mentioned criteria for determining the electromotive force may be changed to select the action showing the highest or lowest electromotive force. Therefore, in principle, there is no limit to the number of actions that can be handled.
以下、図を用いて詳細に説明する。
電極の数を第1の電極4、第2の電極5、そして第3の電極6と3つに増やした電解質素子51の例を図8に示す。ここで、第1の電極4、第2の電極5、第3の電極6をそれぞれ行動A、B、Cに対応させた場合を考える。実施の形態1で述べた2端子電解質素子1を用いた場合と同様に、図9に示すように、報酬確率PAに対応する電流を第1の電極4、第2の電極5、第3の電極6の間に流す。こうした試行を繰り返すことで、最も報酬確率の高い行動を選択することが可能になる。
Hereinafter, it will be described in detail with reference to the drawings.
FIG. 8 shows an example of the
電極の数が3つの3端子電解質素子31を用いた意思決定装置110の例を図10に示す。図10の意思決定装置110では、第1の電極33は、電解質材料層32からなる層を挟んで第2の電極34及び第3の電極35と対向した場合であるが、電極が並列に並んでいる3端子電解質素子51とその機能は変わらない。意思決定装置110では、電源スイッチ41、42、44、45、47,48、及び電圧計43,46,49を使って、実施の形態1と同様の手法で行動A、B、Cに対応して、報酬確率の高い行動を選択することが可能である。
FIG. 10 shows an example of the decision-making
(実施の形態3)
本技術を用いた場合、電解質素子1個による試行では最も報酬確率が高い行動のみしか決定出来ないのに対し、素子を増やすことによってより困難な問題を解くことが可能になる。電極を複数取り付けた電解質素子7及び8を、配線切替機9を介して電源(直流電源)60に接続した学習記憶装置部120を図11に示す。ここで、学習記憶装置部120は、意思決定装置の一部で、学習手段と電荷供給手段からなるモジュールである。
(Embodiment 3)
When this technology is used, only the action with the highest reward probability can be determined in the trial using one electrolyte element, but it becomes possible to solve a more difficult problem by increasing the number of elements. FIG. 11 shows a learning
電解質素子8の最も高い電位を示す電極が第1の電極61の場合、第1の電極61に報酬確率PAに対応する電流を流す。このとき、図12に示すように、電解質素子8の第1の電極64と電解質素子7の第1の電極61とを電気的に繋ぎ、電解質素子7の第1の電極61以外の電極、例えば第3の電極63と、それに対応する電解質素子8の第3の電極66を電源(直流電源)60に電気的に繋ぎ、電流を流す。この場合、電解質素子7の第3の電極63と電解質素子8のそれに対応する第3の電極66には、それぞれ逆の符合の電荷が蓄積される。
When the electrode having the highest potential of the
次に、電解質素子7の第1の電極61以外の電極として第2の電極62を選択した場合は、図13に示すように、ここでも電解質素子7の第2の電極62と電解質素子8の第2の電極65にはそれぞれ逆の符合の電荷が蓄積される。
Next, when the
こうした試行を第1の電解質素子7と第2の電解質素子8で交互に繰り返していくことで、最終的に電解質素子7と電解質素子8は異なった行動を選択するが、これは報酬確率の最も高い上位2つの行動に対応する。
このように、電解質素子1個による試行では最も報酬確率が高い行動のみしか決定出来ないのに対し、電解質素子の数を増やし、配線切替機(配線切替手段)を用いて適宜各電解質素子間の電極の電気的接合と切り離し、電源への接合と切り離しを行うことで上位2つ以上を決定するというより困難な問題を解くことが可能になる。
By alternately repeating such trials in the
In this way, while a trial using one electrolyte element can determine only the action with the highest reward probability, the number of electrolyte elements is increased and a wiring switching machine (wiring switching means) is used to appropriately connect between the electrolyte elements. By disconnecting the electrodes from the electrical junction and joining and disconnecting them from the power supply, it is possible to solve the more difficult problem of determining the top two or more.
以下、実施例により本発明をさらに詳細に説明するが、当然のこととして、本発明は以下の実施例に限定されるものではなく、特許請求の範囲のみにより規定されるものであることに注意されたい。 Hereinafter, the present invention will be described in more detail with reference to Examples, but it should be noted that the present invention is not limited to the following Examples, but is defined only by the claims. I want to be.
(実施例1)
実施例1では、図2に示す意思決定装置100を用いて、意思決定の評価を行った。そこでは、電解質素子11の電極数を2とし、報酬化率PA、PBに応じてその2つの電極間に電源スイッチ15及び16を通じて下記所定の電圧を印加して、起電力の変化を電圧計14でモニターした。電解質素子11の電極4,5にはグラファイトを用い、電解質材料層3の電解質としては液体電解質であるテトラメチルアンモニウム-テトラフルオロボラート(TMA−BF4)を用いた(図5参照)。
(Example 1)
In Example 1, the decision-making
行動A及びBの報酬確率をそれぞれPA=80%、PB=20%とし、正の起電力を示した場合に行動Aを選択、負の起電力を示した場合に行動Bを選択するとした。それぞれの行動A、BにおいてPA、PBの確率で報酬を得た場合に印加する電流値を4mA、得なかった場合の電流値を3.9mAとした。また、電流の印加時間と回路解放時間をそれぞれ1秒間とした。以上の条件で行った試行により両電極間に生じた起電力変化の例を図14に示す。図7を用いて説明したのと同様の起電力変化が数100mV程度の大きさで実際に観察されていることがわかる。これは電流印加により電極界面近傍の電気二重層が変調されることに起因する。
時間に対して報酬確率が変化する行動群の中から場面に応じた強化学習によって最適な行動を選択させるという観点から、PA、PBの変化に対する追従性が重要となる。そこで、この測定では試行回数100回毎にPAとPBの大きさを入れ替えている。その際に装置が報酬確率の高い行動を正しく選択した確率(正答確率)を試行回数に対してプロットすると図15となる。試行回数0回から10回では正答確率が40%以下であるが、試行回数40回でほぼ90%以上に到達している。次に、試行回数100回を超えた時点でPAとPBの値を反転させた所、直後は正答確率が0%に落ち込んだ。しかし、報酬確率の変動に対応して再び正答確率を高め、試行回数150回で再び正答確率がほぼ90%に達した。報酬確率の変動をさらに与えたが、同様に速やかに正答確率を回復させる挙動が観察された。
From the viewpoint of selecting an optimal action by the time reinforcement learning compensation probability corresponding to a scene from the action set which changes with respect to, followability to P A, the change in P B is important. Therefore, and replacing the magnitude of P A and P B in attempts every 100 times in this measurement. At that time, the probability that the device correctly selects an action with a high reward probability (correct answer probability) is plotted against the number of trials, and the result is FIG. The probability of correct answer is 40% or less when the number of trials is 0 to 10, but it reaches almost 90% or more when the number of trials is 40. Next, where by inverting the value of P A and P B at the time of exceeding the number of
図16にPA、PBを70%、30%として図15と同様に試行回数100回毎に入れ替えた際の正答確率の変化を示す。正答確率が90%以上に収束する試行回数が50回から70回と相対的に増加している。これは、図15での試行と比較してPAとPBの値が近く、意思決定までにより多くの試行回数を要する難しい問題であることと対応しており、合理的な結果と言える。
70% P A, P B in FIG. 16 shows a change in the correct probability when replaced in each
(実施例2)
実施例2では、実施例1で用いた装置の電解質のみを液体電解質から固体電解質であるナフィオンに代えて実施例1と同様の測定を行った場合を示す。報酬確率PA、PBを60%、40%として試行回数200回毎に入れ替えて測定を行った結果を図17に示すが、その図から実施例1と同様の正答確率の変化が確認出来る。これは、液体、固体という電解質の状態に関わらずイオン伝導性によって強化学習、及びそれに伴う意思決定が可能となっていることを示している。この例ではナフィオン中を伝導するプロトンによって機能が得られている。
(Example 2)
In Example 2, only the electrolyte of the apparatus used in Example 1 is replaced with Nafion, which is a solid electrolyte, and the same measurement as in Example 1 is performed. Compensation probability P A, the
綱引き原理は、学習結果を強く反映した強化学習に位置づけられている。本発明の意思決定装置は、小型で簡易なデバイスでかつ複雑な計算を必要とせずに、その強化学習に基づいて効率的に意思決定を行うことが可能である。このため、本発明の意思決定装置は産業分野で大いに利用される可能性がある。 The tug-of-war principle is positioned as reinforcement learning that strongly reflects the learning results. The decision-making device of the present invention is a small and simple device, and can efficiently make a decision based on its reinforcement learning without requiring complicated calculations. Therefore, the decision-making device of the present invention has the potential to be widely used in the industrial field.
1:陰イオン
2:陽イオン
3:電解質材料層
4:第1の電極
5:第2の電極
6:第3の電極
7:電解質素子
8:電解質素子
9:配線切替機
11:電解質素子
12:第1の電源スイッチ
13:第2の電源スイッチ
14:電圧計
15,16:入力信号
21,25: MOSトランジスタ
22,26:直流電源
23,27:可変抵抗
24,28:ゲート
31:電解質素子
32:電解質材料層
33:第1の電極
34:第2の電極
35:第3の電極
41,42,44,45,47,48:電源スイッチ
43,46,49:電圧計
51:電解質素子
60:電源(直流電源)
100,110:意思決定装置
120:学習記憶装置部
1: Anion 2: Cation 3: Electrolyte material layer 4: First electrode 5: Second electrode 6: Third electrode 7: Electrolyte element 8: Electrolyte element 9: Wiring switch 11: Electrolyte element 12: First power switch 13: Second power switch 14:
100, 110: Decision-making device 120: Learning storage device
Claims (15)
前記学習手段は、電場によるイオンの輸送が可能な電解質材料層を同一の材料からなる2以上の電極で挟んだ電解質素子からなる、意思決定装置。 A learning means for learning by the accumulation of charge, charge supply means for providing a charge corresponding to actions selected from among different actions of reward probability to said learning means, and the voltage reading means for reading the voltage of said learning means , a decision device for determining an action to choose from different behavior of the voltage by Ri reward probability voltage read by the reading means,
The learning means is a decision-making device including an electrolyte element in which an electrolyte material layer capable of transporting ions by an electric field is sandwiched between two or more electrodes made of the same material.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017016294A JP6872226B2 (en) | 2017-01-31 | 2017-01-31 | Decision maker |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017016294A JP6872226B2 (en) | 2017-01-31 | 2017-01-31 | Decision maker |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018124790A JP2018124790A (en) | 2018-08-09 |
JP6872226B2 true JP6872226B2 (en) | 2021-05-19 |
Family
ID=63109684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017016294A Active JP6872226B2 (en) | 2017-01-31 | 2017-01-31 | Decision maker |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6872226B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7403739B2 (en) | 2018-09-18 | 2023-12-25 | 慶應義塾 | Decision-making device and method for controlling the decision-making device |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0335347A (en) * | 1989-06-30 | 1991-02-15 | Matsushita Electric Ind Co Ltd | Information processing element |
JP5696988B2 (en) * | 2011-06-08 | 2015-04-08 | 独立行政法人物質・材料研究機構 | Synapse operating element |
-
2017
- 2017-01-31 JP JP2017016294A patent/JP6872226B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018124790A (en) | 2018-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10429343B1 (en) | Tunable ionic electronic transistor | |
CN107924995B (en) | Related electronic switch | |
Jiang et al. | Sub-10 nm Ta channel responsible for superior performance of a HfO2 memristor | |
TWI705319B (en) | Apparatuses and methods for generating programmable voltage reference | |
CN110622313B (en) | Memory structure | |
Sahu et al. | Remote control of resistive switching in TiO2 based resistive random access memory device | |
Lapkin et al. | Polyaniline-based memristive microdevice with high switching rate and endurance | |
TW201725467A (en) | Programmable current for correlated electron switch | |
O’Kelly et al. | A single nanoscale junction with programmable multilevel memory | |
Park et al. | Thickness effect of ultra-thin Ta2O5 resistance switching layer in 28 nm-diameter memory cell | |
Meuffels et al. | Fundamental issues and problems in the realization of memristors | |
Parejiya et al. | Improving contact impedance via electrochemical pulses applied to lithium–solid electrolyte interface in solid-state batteries | |
Ma et al. | Formation of the conducting filament in TaO x-resistive switching devices by thermal-gradient-induced cation accumulation | |
TW201724749A (en) | Asymmetric correlated electron switch operation | |
US8711594B2 (en) | Asymmetric switching rectifier | |
Terabe et al. | A variety of functional devices realized by ionic nanoarchitectonics, complementing electronics components | |
JP6872226B2 (en) | Decision maker | |
JPWO2013136798A1 (en) | Resistance change element, semiconductor device having the resistance change element, method for manufacturing the semiconductor device, and programming method using the resistance change element | |
Nagata et al. | Gate tuning of synaptic functions based on oxygen vacancy distribution control in four-terminal TiO2− x memristive devices | |
Strukov | Tightening grip | |
Huang et al. | Three-terminal resistive switch based on metal/metal oxide redox reactions | |
Zhai et al. | Reconfigurable 2D-ferroelectric platform for neuromorphic computing | |
Sial et al. | Artificial nociceptor using liquid ionic memory | |
Gao et al. | Correlation between diode polarization and resistive switching polarity in Pt/TiO2/Pt memristive device | |
JP6712413B2 (en) | Charge state control method using ion transport under magnetic field and its application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210330 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6872226 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |