Advances in Psychology
Vol.
09
No.
01
(
2019
), Article ID:
28431
,
10
pages
10.12677/AP.2019.91006
Identification and Interpretation of Learning Strategies in Classification
Yijun Lai
School of Education, Guangzhou University, Guangzhou Guangdong
Received: Dec. 24th, 2018; accepted: Jan. 7th, 2019; published: Jan. 14th, 2019
ABSTRACT
This paper reviews the methods and techniques of identifying and explaining learning strategies from the perspective of perceptual category learning. Based on the summary of the current research situation in this field, this paper combs and analyzes the mainstream research in the past 20 years from the perspective of perceptual category learning and the identification and interpretation of the learning strategies. By analyzing the application and shortcomings of previous models such as decision-making boundaries model, explicit reasoning model and process learning model, this paper explores the principle and application of IDBM model. This study aims to provide references for the improvement of experimental evaluation methods of cognitive psychology and neuropsychology in China through the study of the identification and interpretation techniques of learning strategies based on perceptual category learning.
Keywords:Learning Strategy, Strategy Identification, Perceptual Category Learning, Iterative Decision-Bound Modeling
分类任务中学习策略的识别与解释
赖奕均
广州大学教育学院,广东 广州
收稿日期:2018年12月24日;录用日期:2019年1月7日;发布日期:2019年1月14日
摘 要
从知觉类别学习的视角对学习策略识别与解释的相关方法和技术进行了回顾。从知觉类别学习和被试学习策略的识别与解释视角出发,对二十多年来的主流研究进行梳理和分析。通过对决策界限模型、外显推理模型、程序性学习模型等既往模型应用的情况和存在的不足进行分析,对该领域未来发展手段,即迭代决策界限建模(IDBM)技术的原理和应用进行探索,希望能为推动我国认知心理学和神经心理学实验评估手段的完善提供借鉴。
关键词 :学习策略,策略识别,知觉类别学习,迭代决策界限建模
Copyright © 2019 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
1. 引言
认知心理学中,识别在实验室实验中被试所用的策略对于解释行为实验的结果十分重要。而类别学习研究作为理解人们类别学习认知加工过程和机制的一个重要方向和目标,知觉类别学习对于被试反应策略的识别与解释,具有十分重要的影响。本文从知觉类别学习的视角出发,在对知觉类别学习进行界定和理论梳理的基础上,对被试反应策略的相关内容进行论述。通过对过去二十年来国内外学者对该研究领域的研究成果进行梳理,探索该领域未来的发展趋势。
2. 知觉类别学习
分类行为对于正常人而言在日常生活必不可少的。从分辨物品是否可食用到分辨敌人朋友,每天我们都在做着成千上万的分类的决策。类别学习是个体通过不断的分类练习,学会类别判断的过程,即学会如何将类别刺激进行分类的过程。在类别学习研究中,可将类别分为知觉类别和概念类别两种。其中知觉类别是指依据事物的特性或是属性之间的共同点而形成的一种客观群体;而概念结构则是指以抽象化的概念而形成的客观群体(Mandler, 1998)。本文主要论述的是知觉类别学习的范畴。
一直以来,研究者们都致力于解答这样一个问题——人类获得类别知识的认知过程是如何进行的(Ashby & Madox, 2005)?针对这一研究主题,发展出很多不同的理论解释。这些理论可以分为单系统理论和多系统理论。单系统理论认为整个类别学习系统是合作的关系,并且所有的类别学习由同一个系统来支配。首先简略阐述一下单系统理论的理论历程。
2.1. 早期知觉类别学习的相关理论
概念学习最早用来解释类别学习,认为学习的过程是使用概念的内涵外延作为标准来进行判断的,这需要人们对于某种类别具有非常具体全面而又细致的认识。掌握某种类别要求能够准确地把我目标类别的全部特性,并且熟练地做出判断,显然这样的学习需要很强的逻辑推理能力和规则总结能力。然而这种理论并不能解释在日常的生活中的所有问题,实际上会有人虽然不知道所有概念的外延和内涵,但依然能对相关的类别做出清晰的判断。
之后出现了以类别标签和空间区域形成链接的认知过程为基础的决策界限理论(Boundary model)。该理论认为类别学习其实就是学习刺激的反应空间。决策界限理论是基于信号检测论而逐渐发展成为的一个新理论,其认为当个体在接触一个新刺激时,需要其所反映的知觉区域,然后再将其划分入该区域内的类别中。这样一来就能够形成一个标准化的决策界限。
后来出现了以相似性为基础解释类别学习的理论,最典型的有两种——原型理论和样例理论。原型理论(Prototype model)是一种表征、属性的综合化概念,是一种分级归类的模式。此理论认为类别学习其实是学习类别的原型。在这种理论下,假若事物与哪一个类别原型之间的相似性最为接近,那么我们就可以将其立即归入该类别。例如,我们一提到鸟,可能就会更多的想起麻雀,而非鹌鹑,这就是原型理论的效应。样例理论(Exemplar model)则假设个体的潜意识里存在诸多的样例,且这些样例各具特征。当需要外部的刺激来对样例进行划分类别时,我们就应该先提取出所有的样例,将各种样例的表征作为原型。在实际识别的过程中,将刺激与自身所划分的类别进行对比分析,以此来确定刺激的类别。这种理论可以有效的论证出原型理论中所无法论证的现象。Love和Medin (1998)提出了一种用来分析个体样例类别的模型——SUSTAIN模型(Supervised and Unsupervised Stratified Adaptive Incremental Network)。该模型认为,在实际学习的过程中,我们可以先假设出一种简单的结构,在必要的情况下可以模拟出一种复杂性的解决方法,以此来论证该类别是否能够被论证。在这个过程中其他群集必然会来表征这个复杂的事件,也就是对这一复杂事件进行解释,从而形成一种新型的类型或是规则。该模型在运用的过程中,不会受到其他因素的影响,也不会受到学习目标或是其他任务的影响,其会专注于推理学习、监督学习以及学习环境等等。
2.2. 知觉类别学习的多重系统理论
1998年,Ashby和Turken在研究中假设类别学习是由至少两个分离的系统进行主导的,并且依赖于两个平行且功能上相互独立的神经环路传导:一个是在意识控制下的基于外显推理的言语分类系统,另一个则是内隐的基于程序学习的非言语分类系统。在类别学习的过程中,这两个系统存在着竞争的关系(competition between verbal and implicit systems)。在此基础上,他们提出了类别学习的多重系统理论(COVIS)。
此理论从提出开始就获得了大量实验数据的支持并在类别学习领域获得了广泛的影响。这其中包括其成功预测了许多两种系统在实验中的分离现象。所谓分离现象,是指在一定的情况下,某些实验条件只单独影响其中的一种类别结构,而对于另外一种类别结构并没有影响,比如反馈的性质和时机(Smith等人,2014)、按键位置的变化(Natal, McLaren, & Livesey, 2013)、任务学习阶段的难度(Spiering & Ashby, 2008)等。这些分离现象在大量的研究中都依赖于基于规则(rule-based)和信息整合(information-integration)分类任务的研究范式才得以证实。该范式包含两种类别结构(category structures):基于规则的类别结构和信息整合的类别结构。在基于规则的类别结构中,理想化的分类规则可以使用语言进行描述,而学习的结果会在很大程度上受到功能与行为的影响。这种类别结构的实验材料选择性较为宽泛。Konishi和 Miyashita等人(1999)使用WCST来对额叶后脑沟进行实验的过程中,发现帕金森症主要是因为大脑中的多巴胺含量急剧下降所促成的,在这种情况下,大脑中的黑质腹区则会被完全覆盖,进而导致帕金森患者的多巴胺水平不断下降,这对于区域涉及的学习会造成巨大的影响。Ashby、Ell和Waldron (2003)在经过长期研究分析后发现,帕金森症患者在类别学习的过程中,其规则并非是固定的,常常会受到外界的影响,这反映出患者的脑部对于规则任务的影响还是比较显著的;而信息整合是指在类别结构中,理想化的类型划分应该是在两个或是多个纬度之间的整合完成以后的结果,且这种整合的结果是无法使用语言进行描述的。而结合现有的参考文献来看,其认为信息的整合应该是与大脑的反应有紧密关联性的,其需要个体的反馈信息来强化对自身的刺激。Seger、Miller在对此问题进行研究分析的过程中使用fMRI技术进行研究,其二人发现在进行信息整合时,个体的纹状体与枕叶会被激活。这一系列的研究结论都有效地反应出信息整合的类别学习在很大程度上依赖于纹状体结构。以经典的二维光栅图实验材料为例,下图展示了基于规则的类别结构与信息整合的类别结构的区别。在图1(A)中基于规则的类别结构的规则能够清晰地口头表达出来:“光栅频率小于300的分为A类,大于300的分为B类”。此类结构的学习过程首先需要在语言系统内形成一个标准化的规则,这种规则应该是与个人的存储记忆相关联的;其次,显示出反馈信息,假若反馈信息与之前的规则并不相同,那么这就说明其与预期之间存在一定的差异,最后,在规则形成以后,进行循环就能够得到最终的结果。而在图1(B)中所示的信息整合类别结构的规则需要整合光栅图的两个维度——频率和方向,且其难以明确地口述出来。所以,信息整合的类别学习是通过一种内隐状态的非语言性系统主导的,个体在无意识下进行判断,需要大量练习以形成刺激–反应联结(Filoteo & Maddox, 2014)。
Figure 1. Examples of rule-based (A) and information integration (B) stimuli and category structures
图1. 基于规则(A)和信息整合(B)类别结构示意图
类别学习在实验中,由于学习内容与方式,刺激材料的维度数量和类别数量,刺激材料的呈现方式,个体特征,认知资源,情绪状态等不同,对被试实验结果会有一定的影响。而在对实验数据进行分析的层面上,也不能忽视识别被试分类策略的方法和技术给实验结论带来的影响。
3. 知觉类别学习的学习策略
人类的类别学习主要有两种策略——规则策略和相似性策略。个体在不同的情境下会倾向性地使用某一种策略。在上文中所提到的早期类别学习理论大体上属于基于单系统模型的类别理论,其中原型理论和样例理论其实都是一种基于相似性的理论,是通过与原型或样例进行相似程度的比较来进行分类的,在进行类别学习时认为个体使用的是相似性策略。而在多重系统理论中,假设在基于规则的类别学习中个体在使用规则策略的情况下能达到最佳分类效果;类似的,在信息整合的类别学习中使用相似性策略才能达到最佳效果。近年来有许多文章致力于研究这两种类别结构策略上的特点。Smith等人通过二维光栅图研究了人类和恒河猴的显性及内隐学习的区别(Smith等人,2010)。实验结果表明人类和恒河猴的基于规则的类别学习成绩更好,说明了恒河猴与人类也许具有类似的外显学习能力。这一结果也表明人类的这种学习能力较为原始,其所主导的大脑皮层也较为基础。此外,Couchman等人的研究表明,人类与恒河猴相比,更倾向于规则策略,而恒河猴更倾向于相似性策略(Couchman, Coutinho, & Smith, 2010)。而且在实验过程中,人类能够针对任务选择相适应的分类策略,这一点是恒河猴不能做到的。这两个实验说明了人类和高级灵长类动物都有分类策略的倾向性,而人类能够根据不同情境的变化完善其策略。
在多重系统理论的研究中,有研究者发现在学习过程中,被试存在着优先使用规则策略的倾向性。特别是在基于信息整合类别结构的分类任务中,在学习开始无法确定分类信息的时候,被试倾向于通过刺激的特征进行分类(即规则策略),因为这种策略有更好的前后内部一致性(Griffiths, Hayes, & Newell, 2012)。直到被试发现当前的反应策略并不能有效提高分类正确率时,才会慢慢改变策略来适应当前的任务。换句话说,在之前没有分类学习的类似训练的情况下,当被试接触到新颖刺激时并不会一开始就使用相似性策略。
根据上文所述,分类任务中研究者能够根据分类的正确率及反应时来粗略地确定被试所使用的策略,却并不能确定被试在学习过程中的策略变化情况。在这种情况下,实验过程中对被试所用策略的识别就有了更高的要求。
4. 识别知觉类别学习学习策略的方法与技术
最早对被试策略进行识别研究的学者Logan (1988)研究认为:识别被试在实验室实验中使用的策略对于解释行为实验的结果是至关重要的。例如,被试在算术技巧的实验中,通过使用算法或记忆检索来添加数字。如果不能确定使用哪种策略,就很难解释反应时间和分类正确率等因变量。在过去的二十多年中,应用于识别被试策略的方法和技术主要可以分为以下几个方面:
4.1. 随机技术模型的应用
Ashby和Gott (1988)则首次提出了“随机化技术”来检测反应策略中变化的存在,以便解决感知分类问题。Ashby和Gott认为:在基本分类实验中,被试在每个实验中接受某类刺激,并通过按下反应键(与A类反应相关联的键或与B类反应相关联的键)将这些刺激中的反应关联到每一个类别。指示反应的正确性的反馈通常(但不总是)在每个反应之后呈现。随机化技术可以用来识别在任意数量的知觉维度上变化的刺激所使用的反应策略,但是大多数应用只适用于二维变化的刺激。
4.2. 决策界限模型(DBM)的应用
一般识别理论(GRT)经常应用于识别实验,其中刺激都是高度可混淆的。在这种情况下,常常由于知觉混乱而产生错误。因此,GRT模型通常将许多参数分配给感知分布。例如,允许每个知觉空间的分布方式是自由参数,并且允许与不同刺激相关联的知觉空间都具有不同的方差和协方差(Ashby & Soto, 2015)。在类别学习实验中,如图2所示,知觉混乱是不可避免的。然而,大多数的错误并不是由这样的混乱造成的,而是由于错误选择了次优的决策策略。为解决这个问题,决策界限模型(DBM)相对于GRT的最通用版本使用了高度简化的知觉反应。
Figure 2. Decision-spaces of two different participants
图2. 两个被试的决策空间
DBM是GRT的一个特例(Ashby & Soto, 2015; Ashby & Townsend, 1986),同时可以认为其是多维化的信号检测理论。与GRT一样,DBM假设刺激和感知系统都是杂乱的。因此,每次呈现刺激时,它都会产生一个新的、独特的感知,即使这个刺激之前已经遇到过。每个感知由多维感知空间中的一个点(每个刺激维度的一个维度)表示,并且所有可能的感知集合由多变量概率分布表示。GRT和DBM假设被试的决策过程将知觉空间划分为反应区域。在每一次实验中,决策过程都记录感知者所在的区域,然后发出相关的反应。
传统的决策界限建模(Ashby, 1992; Maddox & Ashby, 1993)将一些统计模型和决策空间中的数据进行拟合,试图确定被试使用的决策策略的类型。DBM假设被试将知觉空间划分为几个反应区域。在每一次实验中,被试确定该知觉所在的区域,然后发出相关的反应。三种不同的模型通常适合每个被试的反应——假设被试在每次实验中可以有如下三种模型:随机猜测的模型、假设外显推理策略的模型和假设程序性策略的模型。这些模型都没有详细的过程假设。在某种意义上,许多不同的被试反应过程都能与每个模型兼容。例如,如果程序性模型比外显推理模型拟合得好得多,那么就可以确信被试没有使用简单的外显规则。
在过去的25年中,DBM已经被数百篇文章用来识别知觉分类实验中被试的反应策略。它比最好的样例模型(Ashby & Lee, 1991; Maddox & Ashby, 1993; Maddox等人,2002)提供更好的分类数据拟合度,并且成功地通过策略使用(即外显规则与程序性)来分类被试。即使如此,DBM仍有严重限制,即:它假定被试在实验过程中从始至终都使用着同一种反应策略。当然,研究者们期望被试的决策策略在学习过程中改变,并且许多研究已经记录了这种变化(Haider & Frensch, 1996; Kalish等人,2005;Logan, 1988)。总体而言,这些结果表明,被试改变他们的反应策略时,应满足两个条件:1) 已经发生了足够数量的错误;2) 被试知道备选策略。由于这些条件在分类实验中经常得到满足,因此策略的改变是时有发生的,而且很难检测。
4.3. 外显推理模型的应用
外显推理模型假设被试使用了一个易于描述的明确规则(Ashby, 1998)。这意味着该类中的所有模型仅包括垂直于一个或多个刺激维度的决策边界。该类中使用最广泛的模型假设被试在单一维度上设置了决策标准。例如,被试可以基于以下规则做出分类决策:“如果光栅窄则反应A;如果光栅宽则反应B。”这些一维分类模型有两个自由参数——决策规则及感知噪声方差。例如,图2b显示了一个被试的反应假设,即该被试最适合这个类型的DBM。
更复杂的外显推理模型假定了二维规则,如逻辑连接(例如,“如果条窄且条方向陡,则反应A;否则反应B”)或一维分离(例如,“如果光栅是中等宽度,则反应A;如果光栅太窄或太宽,则选择B”)。这两个更复杂的模型示例都具有三个自由参数:每个决策规则一个,以及常见的感知噪声方差。
4.4. 程序性学习模型的应用
程序性学习模型假设在做出决策之前,被试会将来自所有相关被集成维度的感知信息进行整合。这与外显推理模型形成鲜明对比,外显推理模型假设被试对每个相关的刺激维度进行分类决策,然后在需要多于一个标准的情况下组合这些决策。程序性学习模型中的信息整合可以是线性的或非线性的。最常见的情况为线性整合,并由此产生的模型被称为一般线性分类器(general linear classifier, GLC)。GLC假定被试使用线性决策界限划分刺激空间。边界的一侧与“类别A”反应相关联,而另一侧与“类别B”反应相关联。而GLC具有三个参数:线性决策界限的斜率和截距,以及感知噪声方差。图2a中所示的决策空间中被试的反应最适合于GLC。
应该注意的是,对角线界限鼓励被试使用程序性反应策略,因为它们是不明确的口头规则。例如,“如果光栅密度低并角度陡峭,应答A”是描述对角线界限的口头规则,但是这个规则的可行性很低,因为光栅密度和斜率是不同的计量单位。
4.5. 猜想模型的应用
猜想模型假设被试猜想在每次实验中都是随机的。此模型假定被试对每个刺激做出反应“A”的概率(因此也假定反应“B”的概率)是相同的。因此,感知噪声不能改变这些预测的概率,在猜想模型中没有必要考虑感知噪声。因此,猜想模型不包括噪声方差参数。有两种常见的猜想模型,一个版本假设以相等的概率选择每个反应,该模型没有自由参数。第二个模型假设被试用概率p猜想反应“A”,用概率p猜想反应“B”,其中p是自由参数。
上述识别被试分类策略的方法和技术,都曾为心理学知觉类别学习和被试反应的解释做出过贡献。尤其在决策界限模型的常规应用中,基本每个模型都适合于每个被试的反应。每个被试的数据通常被分成至少50个试次,但是更多情况下,都是分为100个或更多试次。研究将模型拟合到单个试次中,模型参数使用最大似然估计(Ashby, 1992),最佳拟合模型通常通过贝叶斯信息准则(BIC)选择:
(1)
其中N是试次量大小,r是模型中自由参数的数量,L是给定模型的数据的可能性(Hélie, 2006)。BIC统计量惩罚不适合的模型和额外的自由参数。为了在一组竞争者中找到最佳模型,只需为每个模型计算BIC值,然后选择具有最小BIC的模型。需要注意的是,模型只使用BIC惩罚模型的额外自由参数,并不假设真实模型是拟合模型之一,因此研究不尝试使用BIC分数来估计模型概率或似然性(Neapolitan, 2004)。
尽管决策界限模型在过去的二十多年中,在识别被试反应策略中被频繁应用,但DBM仍存在一定的不足。如前所述,DBM方法的一个固有限制是其假设被试在每次实验中使用相同的决策策略。在正确率达到渐近线之后,这个假设对实验中的后半段是最有意义的。然而,对于实验最早的阶段来说,这种假设几乎总是错误的。为了最小化策略切换可能产生的问题,将模型与早期阶段中收集的数据相匹配的DBM应用程序通常将试次大小减少到50次左右。但即使使用这种方法也会失败,除非被试恰巧只在51和101的实验中切换策略。否则,假设第一组实验中的反应将由多个不同的决策策略生成,结果所有决策绑定模型将提供对数据的不良拟合。因此,如何构建一种新的拟合方法,以解决DBM这些局限性,让被试在不同区块下都能实现拟合,提升实验准确性,成为学者研究的主要方向。
5. 迭代决策界限建模技术
针对上述DBM模型存在的问题,研究学者提出了新技术的识别目标,即:1) 被试使用的所有反应策略,2) 反应策略的变化,3) 每个变化发生的实验次数,并据此构建了一种新的建模过程,称为迭代决策界限建模(iterative decision-bound modeling, IDBM),它以逐次迭代的方式对DBM进行改进。研究学者使用基准模拟数据引入并验证IDBM,探讨了不同类别的重叠对知觉分类中的反应策略的影响。
5.1. IDBM的原理
Hélie et al. (2016)开发了基于迭代的决策界限建模法(IDBM)。IDBM可以说是DBM的升级,它试图识别每个被试的每一个策略变化。最终产生的结果是被试使用的所有策略的列表、每个策略使用的试次编号以及每一个策略转移发生时的确切试次位置——这些额外的信息,是DBM所不能提供的。IDBM可以提供对类别学习中个体差异的更好理解,并允许对类别学习理论和模型进行更复杂的测试。例如,COVIS (Ashby, 1998)预测,被试在类别学习早期偏向于使用简单规则,并且只有在他们放弃了外显的策略之后,他们才会考虑程序性策略,甚至在程序性策略表现最佳的信息整合任务中也是如此。然而,由于缺乏一种能够在早期学习中观察策略转变的有效方法,COVIS的强预测能力在很大程度上还未被完全开发出来。
IDBM基于DBM之上,将DBM定义为基本模型,对于二维变化的刺激,设立了四个基本模型:1) 猜想;2) 基于X维刺激值的一维规则模型(1DX);3) 基于Y维度上刺激值(1DY)的一维规则模型;4) 一般线性分类器(GLC)。IDBM假设在实验期间,每个被试在基本模型之间进行了一些未知(尽管相当少)次数的切换。策略切换的次数和这些切换发生时的试次位置都是未知的。对于整个数据集,这将产生大量可能的基本模型组合。IDBM使用一种迭代的方法来对所有这些进行排序,并找到一种组合来提供每个被试反应的最佳说明。
在信息整合类别学习任务中,类别的重叠增加了放弃外显规则的被试的比例,并且减少了为了程序策略而放弃规则所需的训练实验次数。IDBM通过被试使用的所有反应策略、反应策略的变化、每个变化发生的实验次数等方面对被试反应策略进行识别,将决策界限模型与感知分类实验中单个被试产生的逐次实验反应进行拟合。仿真结果表明,IDBM能够在实验过程中检测和识别策略切换,并能够准确地估计在低到中等噪声条件下策略切换的实验次数。
5.2. IDBM方法的讨论
不同于传统的DBM,IDBM并不假定被试使用相同的决策策略,对每一个实验,不需要数据被任意分块再进行模型拟合。IDBM通过验证其在噪声模拟数据中识别反应策略的能力,验证了新方法的有效性。基准仿真结果表明IDBM能够检测和识别策略的切换。在高噪声条件下的策略变化更难以检测,但检测时这些变化通常被正确识别。重要的是,IDBM很少产生虚假警报。当数据太嘈杂时,通常错过的是策略切换而不是错误检测。基准测试仿真还表明,IDBM比经典DBM的拟合优势随着数据中噪声的降低而增加。
IDBM又重新分析了Ell和Ashby (2006)关于类别重叠如何影响策略选择的实验研究数据。IDBM的结果表明,与一维规则相比,提高程序性策略的准确性优势不仅增加了被试放弃规则的比例,而且减少了为了放弃规则而支持程序性规则所需的训练实验次数。这一结果与以前的研究(Spiering & Ashby, 2008)一致。分析进一步表明,当基于规则的策略和程序性策略都产生低的分类准确率时,被试往往会灰心丧气,或者猜测,或者在许多反应策略之间摇摆,而从未确定一个稳定的策略。这些结论与先前关于策略切换的研究(Kalish et al., 2005)是一致的,这些结果没有出现在Ell和Ashby (2006)的原始文章中,因为早期使用的方法不允许调查这种详细的假设。
5.3. IDBM方法的一般局限性
IDBM不限于随机化实验,而是可以应用于任何类型的分类实验。进一步说,运用过DBM的研究都可以使用IDBM进行再次分析。而且,迭代算法可以与任何可以使用最大似然和BIC拟合优度统计进行拟合的模型一起使用。例如Donkin et al. (2015)发现,在使用DBM时添加更多模型可以改变结果的解释,得出的结论取决于哪些模型属于基本模型集合,并且一些其他未测试的模型可能比任何基本模型更适合。因此,IDBM确定的策略在测试的替代方案中是最好的。
IDBM也有一定的局限性,其没有解决策略中参数的小改进或调优的可能性。对于IDBM,应用策略方式上的小变化(例如,规则标准的小变化)可能无法检测到,而较大的变化将作为策略的变化而检测到。尽管这些小调整未能让IDBM检测到,但其实实在在在模型中对结果产生了影响。这种简化是IDBM关注策略切换的结果,策略调整却不在所提出的方法范围之内。因此,基于这个局限性,IDBM在未来的发展趋势可能致力于同时解决策略中的连续学习和策略中的突然变化对结果的影响。
与所有迭代拟合过程一样,IDBM可能陷入局部极小值的风险中。因此,在任何给定的迭代中,所选择的切换模型并不包含在切换模型集合中的真实最佳拟合模型设定。然而,IDBM的迭代性质可能有助于避免这种陷阱,因为对于许多连续的迭代,在识别切换之前需要一致地选择相同的切换模型。因为拟合过程的起点是不同的,所以对于连续几个实验,IDBM不太可能系统地落在相同的局部最小值中。因此,虽然不消除局部极小值的风险,但在使用IDBM时不太可能成为严重的问题。
6. 小结
从知觉类别学习的视角对被试反应策略的识别与解释方法和技术进行了回顾。通过研究成果的回顾,推导出识别被试反应策略方法和技术的进步。并通过对决策界限模型、外显推理模型、过程学习模型等既往模型应用的情况和存在的不足进行分析,对IDBM模型的原理和应用进行探索。
IDBM相对于传统模型,在解决策略转换的频率方面有十分积极的意义。包括COVIS和ATIUM (Erickson & Kruschke, 1998)在内的所有当前多系统分类学习模型都只能预测逐次切换。面对实验切换的情况,IDBM存在低估切换频率的风险。这是因为IDBM在识别策略切换方面是保守的。即便如此,IDBM也能够回答切换频率的问题。此外,IDBM还可以用来比较内部切换与系统切换之间的频率。例如,被试在两种外显策略(例如,从1DX到1DY)之间切换比从外显策略切换到程序性策略(例如,从1DX切换到GLC)是否更常见的问题。如果一维规则和过程对偶策略由不同的神经系统介导,那么两个神经系统之间的切换应该不同于两个策略之间的切换,这两个策略都由相同的神经系统介导。传统的模型由于没有识别策略切换的方法,所以无法研究这些问题。如今学者们开发了IDBM来填补这个空白,尽管IDBM在探索类别重叠对策略选择的影响方面具有明显的拟合优势,但IDBM仍有许多需要探索和完善的方面。但总的来说,研究方法的进步,使得识别策略切换的可能性进一步提升,希望IDBM的发展能开辟心理学上一个识别与解释被试分类的新时代。
基金项目
广州市教育科学十二五规划项目(1201421342)部分成果。
文章引用
赖奕均. 分类任务中学习策略的识别与解释
Identification and Interpretation of Learning Strategies in Classification[J]. 心理学进展, 2019, 09(01): 41-50. https://doi.org/10.12677/AP.2019.91006
参考文献
- 1. Ashby, F. G. (1992b). Multivariate Probability Distributions. In F. Ashby (Ed.), Multidimensional Models of Perception and Cognition. Hillsdale, NJ: Erlbaum.
- 2. Ashby, F. G., & Gott, R. E.(1988). Decision Rules in the Perception and Categorization of Multidimensional Stimuli. Journal of Experimental Psychology: Learning, Memory, and Cognition, 14, 33-53. https://doi.org/10.1037/0278-7393.14.1.33
- 3. Ashby, F. G., & Maddox, W. T. (2005). Human Category Learning. Annual Review of Psychology, 56, 149-178. https://doi.org/10.1146/annurev.psych.56.091103.070217
- 4. Ashby, F. G., & Soto, F. A. (2015). Multidimensional Signal Detection Theory. In J. Busemeyer, J. Townsend, Z. Wang, & A. Eidels (Eds.), Oxford Handbook of Computational and Mathematical Psychology. New York: Oxford University Press.
- 5. Ashby, F. G., Alfonso-Reese, L. A., Turken, A. U., & Waldron, E. M. (1998). A Neuropsychological Theory of Multiple Systems in Category Learning. Psychological Review, 105, 442-481. https://doi.org/10.1037/0033-295X.105.3.442
- 6. Ashby, F. G., Ell, S. W., & Waldron, E. M. (2003). Procedural Learning in Perceptual Categorization. Mem Cognit, 31, 1114-1125. https://doi.org/10.3758/BF03196132
- 7. Ashby, F.G., & Lee, W.W. (1991). Predicting Similarity and Categorization from Identification. Journal of Experimental Psychology: General, 120, 150-172. https://doi.org/10.1037/0096-3445.120.2.150
- 8. Ashby, F.G., & Townsend, J.T. (1986). Varieties of Perceptual Independence. Psychological Review, 93, 154-179. https://doi.org/10.1037/0033-295X.93.2.154
- 9. Couchman, J. J., Coutinho, M. V. C., & Smith, J. D. (2010). Rules and Resemblance: Their Changing Balance in the Category Learning of Humans (Homo Sapiens) and Monkeys (Macacamulatta). Journal of Experimental Psychology: Animal Behavior Processes, 36, 172-183. https://doi.org/10.1037/a0016748
- 10. Donkin, C. et al. (2015). Identifying Strategy Use in Category Learning Tasks: A Case for More Diagnostic Data and Models. Journal of Experimental Psychology: Learning, Memory, and Cognition, 41, 933-948. https://doi.org/10.1037/xlm0000083
- 11. Ell, S. W., & Ashby, F. G. (2006). The Effects of Category Overlap on Information-Integration and Rule-Based Category Learning. Perception and Psychophysics, 68, 1013-1026. https://doi.org/10.3758/BF03193362
- 12. Erickson, M. A., & Kruschke, J. K. (1998). Rules and Exemplars in Category Learning. Journal of Experimental Psychology: General, 127, 107-140. https://doi.org/10.1037/0096-3445.127.2.107
- 13. Filoteo, J. V., & Maddox, W. T. (2014). Procedural-Based Category Learning in Patients with Parkinson’s Disease: Impact of Category Number and Category Continuity. Frontiers in Systems Neuroscience, 8, Article 14. https://doi.org/10.3389/fnsys.2014.00014
- 14. Griffiths, O., Hayes, B. K., & Newell, B. R. (2012). Feature-Based versus Category-Based Induction with Uncertain Categories. Journal of Experimental Psychology. Learning, Memory & Cognition, 38, 576. https://doi.org/10.1037/a0026038
- 15. Haider, H., & Frensch, P. A. (1996). The Role of Information Reduction in Skill Acquisition. Cognitive Psychology, 30, 304-337. https://doi.org/10.1006/cogp.1996.0009
- 16. Hélie, S. (2006). An Introduction to Model Selection. Tutorials in Quantitative Methods for Psychology, 2, 1-10.
- 17. Hélie, S., Turner, B. O., Crossley, M. J., Ell, S. W., & Ashby, F. G. (2016). Trial-by-Trial Identification of Categorization Strategy Using Iterative Decision Boundmodeling. Behavior Re-search Methods, 49, 1146-1162. https://doi.org/10.3758/s13428-016-0774-5
- 18. Kalish, M. L., Lewandowsky, S., & Davies, M. (2005). Error Driven Knowledge Restructuring in Categorization. Journal of Experimental Psychology: Learning, Memory, and Cognition, 31, 846-861.
- 19. Konishi, S. et al. (1999). Common Inhibitory Mechanism in Human Inferior Prefrontal Cortex Revealed by Event-Related Functional MRI. Brain, 122, 981-991. https://doi.org/10.1093/brain/122.5.981
- 20. Logan, G. D. (1988). Toward an Instance Theory of Automatization. Psychological Review, 95, 492-527. https://doi.org/10.1037/0033-295X.95.4.492
- 21. Love, B. C., & Medin, D. L. (1998). SUSTAIN: A Model of Human Category Learning. In C. Rich, & J. Mostow (Eds.), Proceedings of the Fifteenth National Conference on Artificial Intelligence (pp. 671-676). Cambridge, MA: MIT Press.
- 22. Maddox, W. T., & Ashby, F. G. (1993). Comparing Decision Bound and Exemplar Models of Categorization. Perception and Psychophysics, 53, 49-70. https://doi.org/10.3758/BF03211715
- 23. Maddox, W. T., Ashby, F. G., & Waldron, E. M. (2002). Multiple Attention Systems in Perceptual Categorization. Memory and Cognition, 30, 325-339. https://doi.org/10.3758/BF03194934
- 24. Natal, S. D. C., Mclaren, I. P. L., & Livesey, E. J. (2013). Generalization of Feature- and Rule-Based Learning in the Categorization of Dimensional Stimuli: Evidence for Dual Processes under Cognitive Control. Journal of Experimental Psychology: Animal Behavior Processes, 39, 140-151.
- 25. Neapolitan, R. (2004). Learning Bayesian Networks. Upper Saddle River, NJ: Prentice Hall.
- 26. Smith, J. D., Beran, M. J., Crossley, M. J., Boomer, J., & Ashby, F. G. (2010). Implicit and Explicit Category Learning by Macaques (Macacamulatta) and Humans (Homo Sapiens). Journal of Experimental Psychology: Animal Behavior Processes, 36, 54-65.
- 27. Spiering, B. J., & Ashby, F. G. (2008). Initial Training with Difficult Items Facilitates Information Integration, But Not Rule-Based Category Learning. Psychological Science, 19, 1169-1177. https://doi.org/10.1111/j.1467-9280.2008.02219.x