浅论强化理论的发展(精选3篇)

瑶台分享2017-06-02 05:25:37 次阅读

浅论强化理论的发展篇一

强化理论是心理学中一种重要的学习理论，它主要研究动物和人类在特定环境中通过行为和反馈之间的关联来学习和适应。强化理论的发展经历了多个阶段，从最初的行为主义观点到现代的认知神经科学研究，不断地丰富和完善了这一理论。

在行为主义的早期阶段，强化理论主要关注外部刺激对行为的影响，强调行为与环境之间的直接关联。通过实验研究，行为主义者发现，当某种行为受到积极的反馈和奖励时，被强化的行为更有可能再次出现，而受到惩罚的行为则会减少。这一观点对于行为调节和训练有着重要的指导意义，成为教育和治疗领域的重要工具。

随着心理学的发展和认知科学的兴起，强化理论逐渐从行为层面转向对内在认知过程的研究。认知神经科学的研究发现，强化行为涉及到多个脑区的协同作用，包括奖赏预测、决策制定和动作执行等过程。这一发现使得研究者能够更深入地理解强化行为的神经机制，为治疗和干预提供了更加科学和精准的方法。

近年来，强化理论的发展又受到了机器学习和人工智能的影响。强化学习是机器学习中的一种重要技术，通过模拟智能体与环境的相互作用，使其能够通过试错学习来提高决策能力。强化学习的应用领域非常广泛，包括机器人控制、自动驾驶、游戏策略等。这一领域的发展不仅推动了强化理论的进一步完善，也为人类学习和适应提供了新的思路和方法。

总结起来，强化理论的发展经历了行为主义、认知神经科学和机器学习的多个阶段，从外部刺激到内在认知过程再到机器智能，不断地丰富和完善了这一理论。强化理论的研究不仅对于心理学和教育学有重要意义，也为机器学习和人工智能的发展提供了重要的理论基础。

浅论强化理论的发展篇二

强化理论作为一种心理学的学习理论，对于人类的学习和适应有着重要的指导意义。在强化理论的发展过程中，不同的研究者和学派提出了各自的观点和解释，为我们理解学习和行为的本质提供了丰富的思考。

强化理论的发展始于行为主义学派的兴起。行为主义者认为，行为是由外部刺激所引起的反应，而强化则是行为与外部刺激之间的关联。通过实验研究，行为主义者发现，在行为受到积极的反馈和奖励时，被强化的行为更有可能再次出现，而受到惩罚的行为则会减少。这一观点为教育和治疗提供了重要的指导原则，成为行为调节和训练的基础。

然而，行为主义的观点并不能完全解释人类学习和行为的复杂性。在认知心理学的发展中，强化理论逐渐从行为层面转向对内在认知过程的研究。认知神经科学的研究发现，强化行为涉及到多个脑区的协同作用，包括奖赏预测、决策制定和动作执行等过程。这一发现使得研究者能够更深入地理解强化行为的神经机制，为治疗和干预提供了更加科学和精准的方法。

在当代科技的推动下，强化理论的研究又迎来了新的突破。机器学习和人工智能的发展使得强化学习成为一个热门领域。强化学习是一种通过试错学习来提高智能体决策能力的方法。它模拟了生物学习的过程，通过与环境的相互作用来不断优化行为策略。强化学习的应用领域非常广泛，包括机器人控制、自动驾驶、游戏策略等。这一领域的发展不仅推动了强化理论的进一步完善，也为人类学习和适应提供了新的思路和方法。

浅论强化理论的发展篇三

浅论强化理论的发展

　　论文关键词：效果律　操作强化　认知强化

　　论文摘要：强化理论是当代学习学最重要的理论之一，广义上的强化理论包括桑代克的效果律、斯金纳的操作强化理论和班杜拉的认知强化理论。发展的强化理论已从Ｓ－Ｒ条件作用理论转向为认知交互作用理论，强化因此而被赋予了特殊的涵义。　　
　　
　　强化理论是当代学习心最重要的理论之一，实验和实践一致证明：效果律—强化原理确是对人类学习可靠的和有力的概括。需要注意的事实是：学习理论在整个２０世纪一直处于发展过程之中，如今的强化理论较之联结主义的“快乐—痛苦原理”已具有重要的扩充、修正乃至颠覆的含义，其实质已从Ｓ—Ｒ条件作用理论转向为认知交互作用理论。然而，当今的领域仍存在着把桑代克的效果律和斯金纳的操作强化在一个“有效”的基础上作为手段而简单、直接运用于实践中的现象。为此，有必要梳理强化理论的发展脉络，把握当代强化理论的要义。
　　
　　一、桑代克的效果律
　　
　　桑代克的联结主义心理学依据机能主义的观点，以刺激与反应之间的联结替代了赫尔巴特主义的观念的联结，并将联结分为先天（本能）和习得（习惯）两大类。桑代克认为，学习是联结的形成与巩固［１］。从尝试与错误的动物学习实验中，桑代克得出了著名的快乐—痛苦原理即效果律：一种反应如果伴随着快乐的体验，那么它就会被增加；如果伴随着痛苦，就会被减弱［２］。
　　桑代克自称是机能主义者，但他的联结主义仍是Ｓ—Ｒ条件作用理论，因而“联结主义”这个术语在更广泛的意义上也是“行为主义的”。桑代克动物实验中的学习情境与后来斯金纳的白鼠压杆情境在基本特征上并无不同，在桑代克的尝试与错误学习中，当动物通过活动达到一“满意事态”，便设想学习受到了积极影响，即“满意事态”促使之前活动逐渐增强。斯金纳用强化这个概念鉴别出被桑代克称作效果律的事件，因而，可以把桑代克尝试错误学习中最重要的发现更好地描述为强化理论。
　　
　　二、斯金纳的操作强化理论
　　
　　斯金纳是激进行为主义者，其基本立场为心理学是研究外部行为而且只研究外部行为的一门科学。斯金纳认为人的行为主要由操作条件反射构成，塑造行为的过程就是学习的过程，强化是其学习理论中的核心概念。“如果一个操作发生后，接着给予一个强化刺激，那么其强度就增加。”斯金纳通过实验发现：操作行为存在消退现象，消退的行为主要缘于以往操作条件作用的结果。与桑代克的效果律作对比，斯金纳的强化理论与效果律的前半段同质，而用“消退”这个概念替换了效果律的后半段，且回避掉桑代克效果律中“快乐”与“痛苦”等字眼。
　　操作强化理论中，斯金纳区分出两种强化物：积极强化物和消极强化物。当一种刺激的呈现会增强某一行为的发生概率时，这种刺激物就是积极强化物；反之，当一种刺激的消除会增强某一行为的发生概率时，这种刺激物就是消极强化物。从此定义中我们看到，这两类强化物导致的结果相同，都是某一行为发生概率增强，斯金纳强调两类强化物的差异在于刺激条件不同。但是进一步分析刺激条件，刺激呈现或刺激消除实际上具有同一种性质——奖励，那么斯金纳区分两种强化物的依据到底是什么？从两类强化物的具体化罗列中很容易发现，积极强化物多是某种令人愉悦的事物，而消极强化物则多是令人讨厌的事物。但斯金纳却否认下列说法：积极强化物产生令人愉悦的情感，消极强化物产生让人讨厌的结果，也就是说斯金纳宁肯将两类强化物的区分依据只分析至刺激条件（行为）层面，尽管这种区别性质上并无差异，也不愿意作进一步的分析和解释，不愿承认刺激物性质实质上是其区分依据。联想到上文谈及的操作强化理论与效果律的对比分析，可以推断：斯金纳是在刻意回避“快乐”、“痛苦”、“愉悦”、“讨厌”等词汇。对此，斯金纳有过一个解释：强化物不具备“高兴”、“不高兴”此类特征。诚然，刺激作为事物本身被分析时，确实不具备“高兴”或“不高兴”等物理特征。但刺激成为强化物时，就不仅仅作为事物本身，而是必将与反应着的个体联系在一起被分析。因此，斯金纳的这个解释实在太多勉强。刺激本身具有的物理特征和强化物所具有的特征是两个不同的概念，这是其一；其二，如果强化物不具备“高兴”、“不高兴”此类特征，将无法解释强化物与反应变化之间的因果关系。事实上，斯金纳解释中的另一句话才是他回避的真正理由：物理学上没有“高兴”、“不高兴”之类的术语。对斯金纳来说，要描述强化物的性质，必然要涉及“愉悦”、“讨厌”此类术语，而一但涉及此类术语，必将研究精神世界，也就必然要使用和行为主义所认为的唯一科学的研究方法——实验分析相抵触的方式。在斯金纳看来，一个行为不管如何不完全，也比心灵主义的解释更有价值。
　　同样，斯金纳对“惩罚不是强化”之论断的解释亦存在同样的问题。当把强化界定成结果为反应增强的过程时，惩罚已自然地被排除在外。界定强化时，斯金纳恪守着激进行为主义的准则：直接研究刺激与反应之间的相互关系，不要在它们中间加入任何形式的生理或假设。而在解释论断时，斯金纳实际上是考虑了情感、动机此类个体心理特征，却囿于激进行为主义的基本假设，刻意回避并拒绝进一步解释。斯金纳强化理论中的自相矛盾和解释的缺乏，已显露出行为主义基本假设及其研究准则存在着严重的问题。
　　
　　三、班杜拉的认知强化理论
　　
　　班杜拉因为主张心应主要研究外显行为，强调行为的结果对行为的影响及强化的重要作用，常被归为新行为主义者行列。但，班杜拉与行为主义者对人的'本质的假定存在着根本的不同。行为主义者认为人本质上是一台设计精良的机器，而班杜拉认为人是有思想的有机体，具有给自己提供某种自我力量的潜能”［３］。班杜拉重视观察学习、认知过程以及自我调节过程的作用，其学习理论亦应从属于认知交互作用理论范畴。
　　班杜拉的社会学习理论主要是一个认知强化理论。“结果决定行为”是被行为主义者广泛接受的信条，班杜拉亦同意一个人先前行为的结果在很大程度上决定这个人的将来行为。但传统的行为主义者认为，结果强化行为是一个自动的过程，班杜拉反对这一论断。他认为结果之所以能够强化行为，是因为这些结果具有信息和动机价值，即过去行为使得我们产生了预期，希望在将来的相似情境中也能够得到相似的结果。“除非人们意识到事件之间的相关，否则个体就不从重复的配对经验中学到任何东西”［４］。在这一强化过程中，人是有着预见性期望的信息加工者和解释者。人们对于学习意义的认知，在他将来行为的习得和保持中都将发挥重要的作用。在班杜拉这里，强化因此而被赋予了特殊的含义。强化过程既不是中心的过程，也不是个体中心的过程，而是个体利用直接经验结果和观察到的经验结果，以认知期望为中介，人们自我激发的过程。
　　班杜拉认为存在三种形式的强化，这三种强化都具有认知交互的特征。第一种是直接外部强化，斯金纳理论中分析的均是此类强化。与斯金纳不同之处在于，班杜拉强调带来强化效果的奖赏具有信息和动机两种功能。第二种是替代强化，即个体以他人在相似情境中的行为结果为基础来调控和改变自己的行为，众多操作强化理论无法解释的学习现象可以用替代强化来解释。替代强化是通过榜样模仿形成的，认知因素在此过程中起着重要的作用。它在很大程度上决定个体观察什么、赋予它们何种意义，以及它们所预示的信息应该如何被组织以备将来利用。第三种是自我强化，即个体以自己创设的结果标准为基础

来调控自己的行为。班杜拉认为，个体的行为并不只是迎合他人的喜好，许多行为变化用刺激—反应理论无法解释；且在并不存在外在奖励或惩罚的情况下，个体依然会有行为的保持或改变，这种保持或改变缘自个体的自我奖励或惩罚。个体通过规范和观察，自己给自己设定了行为标准，依据这些内心准则对自己的行为作出评价，进而调节行为。当外部强化与内部准则发生冲突时，个体如何行动取决于外部力量与内部力量的对比结果。“忽视这种隐蔽的自我强化所具有的作用就等同于忽视人类的独特能力”［５］。
　　
　　参考文献：
　　［１］车文博．西方心理学史［Ｍ］．浙江：浙江出版社，１９９８．３４３．
　　［２］［４］［５］【美】ＭｏｒｒｉｓＬ．Ｂｉｇｇｅ，ＳａｍｕｅｌＳ．Ｓｈｅｒｍｉｓ．写给教师的学习心理学［Ｍ］．徐蕴，张军华等译．北京：中国轻出版社．２００５．３５．１１２．１１３．
　　［３］施良方．学习论——学习心理学的理论与原理［Ｍ］．北京：人民教育出版社，１９９４．３９７．

未完...展开全文