reinforcement
「reinforcement」とは・「reinforcement」の意味
「reinforcement」は、心理学において、ある行動が増加するように働く要因を指す。また、クラクラというゲームでは、援軍を意味する。一般的には、補強や強化という意味で使われることが多い。可算名詞であり、複数形は「reinforcements」となる。「reinforcement」の発音・読み方
「reinforcement」の発音は、リインフォースメント(/ˌriːɪnˈfɔːrsmənt/)である。「reinforcement」の語源・由来
「reinforcement」は、英語の「reinforce」という動詞に由来し、これは「強化する」という意味を持つ。また、「reinforce」は、フランス語の「renforcer」から来ており、これは「強くする」という意味である。「reinforcement」を含む英熟語・英語表現
「I need reinforcements」とは
「I need reinforcements」とは、「援軍が必要だ」という意味である。戦闘や競技などで、自分のチームに追加の助力が必要な状況を表す。「reinforcement」に関連する用語の解説
「positive reinforcement」とは
「positive reinforcement」は、心理学において、行動の後に何らかの報酬が与えられることで、その行動が増加する現象を指す。例えば、子供が宿題を終えた後にお菓子を与えることで、宿題をする行動が増加する。「reinforcement learning」とは
「reinforcement learning」は、機械学習の一種で、エージェントが環境と相互作用しながら、報酬を最大化するような行動を学習する方法である。この学習方法は、人間や動物の学習過程に似ているとされる。「negative reinforcement」とは
「negative reinforcement」は、心理学において、行動の後に不快な刺激が取り除かれることで、その行動が増加する現象を指す。例えば、頭痛がするときに薬を飲むことで、頭痛が治まるため、薬を飲む行動が増加する。「reinf」とは
「reinf」は、「reinforcement」の略語であり、読み方はリインフォースメントと同じである。主に、文章や会話で短縮形として使用されることがある。「reinforcement」の使い方・例文
1. The bridge needs reinforcement to withstand the heavy traffic.(橋は、重い交通量に耐えられるように補強が必要である。) 2. The teacher used positive reinforcement to encourage the students.(先生は、生徒たちを励ますためにポジティブリインフォースメントを使用した。) 3. The army sent reinforcements to the battlefield.(軍は戦場に増援を送った。) 4. The company implemented a reinforcement learning algorithm to optimize its operations.(会社は、業務を最適化するために強化学習アルゴリズムを導入した。) 5. The coach used negative reinforcement to improve the team's performance.(コーチは、チームのパフォーマンスを向上させるためにネガティブリインフォースメントを使用した。) 6. The wall requires reinforcement to prevent it from collapsing.(壁は、崩壊を防ぐために補強が必要である。) 7. The manager called for reinforcements to handle the increased workload.(マネージャーは、増加した仕事量に対処するために増員を要求した。) 8. The scientist studied the effects of reinforcement on animal behavior.(科学者は、動物の行動に対するリインフォースメントの効果を研究した。) 9. The reinforcement of the building's structure was necessary to meet safety standards.(建物の構造の補強は、安全基準を満たすために必要であった。) 10. The robot used reinforcement learning to adapt to its environment.(ロボットは、環境に適応するために強化学習を使用した。)リーンフォースメント
補強部材のこと。メンバー、リーンフォースメント、スティフナー、プレート、ブラケット、ガセットなどの名称で呼ばれているが正確な分類は定められていない。慣習的に大物補強部材をメンバーやリーンフォースメントとして使い分けている。モノコック構造のボディシェルではエンジン、シャシー、衝突などから入る大荷重や集中荷重をこれらの補強部材で受け止め、アウターパネル、インナーパネルで荷重を分散させている。
参照 メンバー補強材
部材の強度、剛性を高めるために付加・付与する部品または材料のこと。大別すると、構造物の強度、剛性を高めるための補強部材と、材料の強度、靭性などを上げるために付与する補強材がある。自動車でいうと、前者はルーフ、ボンネットなどのボディパネル補強用リーンフォースメントや、シリンダーブロック下部に組み付け、剛性を上げるための主軸受けを一体化したラダーフレームなどがある。後者にはエアダムなどのエアロパーツおよび内外装品に使われている繊維強化樹脂のような、複合材料の補強材(この場合は繊維)などがある。
参照 スティフナー、リーンフォースメント強化
読み方:きょうか
条件づけのタイプによって、強化の概念は次のように相違する。①Pavlovian 条件づけ:中性刺激(条件刺激)と誘発刺激(無条件刺激)を時間的に接近して反復提示する手続き(これを対提示という)、あるいはこの結果として生じる条件づけの強度を増大させる過程をいう。条件刺激と無条件刺激の時間的関係に基づいて、次の5種類の基本的なパラダイムがある。同時条件づけ(simultaneous conditioning):条件刺激がまず提示され、5秒以内に無条件刺激も提示されて、両者は同時に終結する。延滞条件づけ(delayed conditioning):条件刺激の提示後5秒以上経ってから、無条件刺激が提示され、両者は同時に終結する。痕跡条件づけ(trace conditioning):条件刺激の提示は短時間で終結され、一定時間経過後に無条件刺激が提示される。逆行条件づけ(backward conditioning):無条件刺激の提示後に条件刺激が提示される。Pavlovian 条件づけの統制手続きとして用いられることがある。時間条件づけ(temporal conditioning):一定の時間間隔のもとで無条件刺激だけが規則的に提示される。したがって、明確な外部刺激としての条件刺激は提示されない。②オペラント条件づけ:反応の自発に後続して強化刺激を提示したり除去したりする手続き、あるいはこの結果として生じる反応の自発頻度を増加させる過程をいう。
強化
行動主義心理学における強化(きょうか、reinforcement) とは、条件づけの学習の際に、刺激と反応を結びつける手段または、それによって結びつきが強まる働きのことである。
広義には報酬、罰などの強化子 (reinforcer) のこともさす。基本的には古典的条件付けにおける無条件刺激を提示する手続きまたは、報酬を与える手続きあるいは手続きによって被験個体のおかれている状況や特定の反応との結合が強まることをさす。個体の生存に直接関係し生得的である一次性強化子と経験を通じて習得される二次性強化子に分類される。
オペラント条件づけ
オペラント条件づけ(operant conditioning)とは、バラス・スキナーによって導入された経験的パラダイムであり、これは動物が環境に基づいて自由に操作できるという理論である。このパラダイムにおいては、実験者は求める反応を自主的には引き起こすことができない。実験者は、対象から放出される応答が起こるのを待って、それに対して強化子ポテンシャルを送達する。一方で古典的条件づけパラダイムにおいては、実験者が望む反応を引き出すために、反射を誘発する刺激を送信しており、「無条件刺激」(UCS)、「条件付刺激」(CS)などがある。
「強化」はオペラント条件づけにおける基本用語である。対となる用語には「弱化」がある。
正の強化
正の強化(Positive reinforcement)は、好ましい事象・刺激が行動の結果として提示され、それによって、その行動が増加する場合に起こる[1]:253。正の強化子は、動物がそれを獲得するために働く刺激事象である。 言葉および物理的報酬は、非常に効果のある正の強化子である[2]。
- 例:企業はインセンティブ・プログラムを実施し、従業員は販売された品目の数に応じて賞を獲得するとする。従業員が受け取った賞は、これにより売上が増加した場合は正の強化子とみなされる。
負の強化
負の強化(Negative reinforcement)は、嫌悪的な事象・刺激が除去されたり、起こらないようにすることを目的として、その行動の頻度が増加している場合に起こる[1]:253。負の強化子は、生物が断念、脱出、先送りをするために働く刺激事象である。正の強化子とは対照的で、口頭や物理的な罰であっても負の強化となりえる [3]
- 例:ある従業員が金曜日までに割り当てられた作業を完了すると、土曜日は休暇を取ることができるというルールがあるとする。土曜日に労働することは負の強化子であり、負の強化子の使用を避けようとするので、従業員の生産性が向上する。
強化と弱化
強化は行動を増やすのに役立ち、弱化は行動を減らす働きをする。したがって、正の強化子は、動物が達成するために働く刺激物であり、負の強化子は、動物が回避または終了するように働く刺激物である[4]。違いを以下の表に示す。
報酬的(楽しい) 刺激 | 嫌悪(不快な)刺激 | |
---|---|---|
追加/実行 | 正の強化(Positive Reinforcement) | 正の弱化(Positive Punishment) |
除去/撤退 | 負の弱化(Negative Punishment) | 負の強化(Negative Reinforcement) |
脚注
- ^ a b Flora, Stephen (2004). The Power of Reinforcement. Albany: State University of New York Press
- ^ Nikoletseas Michael M. (2010) Behavioral and Neural Plasticity, p. 143 ISBN 978-1453789452
- ^ Nikoletseas Michael M. (2010) Behavioral and Neural Plasticity. ISBN 978-1453789452
- ^ D'Amato, M. R. (1969). Melvin H. Marx. ed. Learning Processes: Instrumental Conditioning. Toronto: The Macmillan Company
関連項目
- reinforcementのページへのリンク