抄袭,匹配抄袭,匹配抄袭,统计Thayer,Lewis,兼顾两种匹配考试抄袭统计量探讨评述

更新时间：2024-02-28 点赞:14678 浏览:52366 作者：用户投稿原创标记本站原创

摘要：考试抄袭统计量是专门用于识别抄袭的统计指标。它们是以被怀疑抄袭者和抄袭来源匹配反应的数目为建立的，按其考虑的匹配反应信息可分为两类：一类只考虑被怀疑抄袭者和抄袭来源间的错误答案匹配；另一类考虑错误答案匹配和正确答案匹配。类抄袭统计量对那些只以抄袭来源处抄袭正确答案的抄袭者检测不敏感，所以有着缺陷；类抄袭统计量兼顾两种匹配，考虑的信息更全面。s2、g2、ω是具有代表性的类抄袭统计量，它们在测量论述、被怀疑抄袭者和抄袭来源的异常反应方式确定策略教学论文及考试抄袭检测效能等有着差别，在抄袭识别运用中应选择。

词：抄袭统计量；k指数；s2指数；g2指数；ω指数

中图分类号：B841.2
文献标识码：A 文章编号：1003-5184(2012)01-0086-05

以古，考试和就像一对孪生兄弟一样形影不离，在古代的科考最为常见的手段是夹带、贿赂主考官及请人代考，社会的不断进步，高科技工具不断涌现，现象就更加泛滥，它挑战了考试的公正性，威胁着教育质量。，现象了考生、家长、教育机构、考试中心、政府部门的。在众多的方式中，抄袭是最识别的方式，被试夹带，即使监考老师被试的偷看，但在无物证的条件下，仅凭此视觉证据将被试确定为抄袭者(Cizk，1999)。实际上，抄袭发生在座位相邻的考生之间，被试间还笔敲桌子、脚轻叩、手指比划等多种方式传递信息。当然，对学生诚信考试态度的培养、监考人员的严格培训及考试座位的布局在上减少抄袭的发生，但在监考人员抄袭现象却缺乏物证的情况下，抄袭统计量给抄袭识别更多的证据。
有关考试抄袭统计量的探讨是以20世纪20年始的，教育统计与测量学的进展，探讨者们开发的考试抄袭统计量越来越多，如：ESA、Bm、g2、k、s2、ω、kappa等(Bay，1995；Belov，2010；Sotaridona，2006)，统计量还在实际考试情景中得以运用，如：k指数在SAT运用(Lewis，1998)、ω指数在MPRE运用等(Wollack，2003)。这些统计量以被怀疑抄袭者和抄袭来源匹配反应的数目为而建立的，但它们之间也有着差别：一类是只考虑被怀疑抄袭者和抄袭来源的错误答案匹配数目，如，ESA、k、s1、kappa等(Sotaridona，2002，2003，2006；Wollack，2004)；另一类是考虑的错误答案匹配数目和正确答案匹配数目，如，g2、s2、ω等(Frary，1997；Sotaridona，2003；Wollack，1997)。类抄袭统计量对那些只以抄袭来源处抄袭正确答案的抄袭者检测效果迟钝，在运用上有着缺陷。类抄袭统计量兼顾两种匹配，考虑的信息更全面，，将在简要浅析只考虑错误答案匹配数目的代表性指标——k指数的特点上，探讨既考虑错误答案匹配又考虑正确答案匹配的类抄袭统计量的统计特性及抄袭检测性能，并与k指数的比较此类统计量的优势。
1 以匹配错误回答数目为的抄袭统计量——k指数

1.1 抄袭统计量的统计原理

第32卷第1期
甘媛源等兼顾两种匹配的考试抄袭统计量探讨评述
心理学探新2012年
抄袭统计量的原理是在抄袭的假设条件下建立被试反应概率的模型，上被试间有着反应方式的概率，比较被试间有着的异常的反应方式，有着这一异常方式的一组被试就可被是可能的抄袭者和抄袭来源(韩丹，郭庆科，王昭，陈雪霞，2008)。
在考试中，任意两个独立的被试都有着相同的项目反应方式，，被试选择了相同的正确答案，相应地，任何两个被试也有可能选择相同的错误答案，那些具有良好区分度的多项选择题一般都会设置诱惑性强的错误选项来吸引能力较低的被试，让趋于选择这一错误选项，，两个独立的被试选择了相同的错误选项是正常的。，某些类型的一致回答却是异常的，，能力的被试能连续正确回答出非常难的项目，这所谓的异常反应方式。当然，匹配反应方式较少时可能是偶然因素造成的，但当这样的匹配反应方式时，就具有了统计学作用小学数学教学论文，并为识别被试的了。

1.2 k指数

仅考虑被试间匹配错误答案数目的代表性抄袭统计量是由Holland的k指数(Holland，1996)。下面以k指数为例对类抄袭统计量作简要。
在k指数的计算中，将具有相同错误答案数目的被试分成一组，被试就被分为R组，第r 组(r=1，2，…R)被试记为j(j=1，2，…Jr)，也说，在第r组Jr个被试有相同的错误项目数，将含有被怀疑抄袭者c的被试组定义为第c′组，用Jc′表示第c′组中所的被试人数，，rj表示在r组被试j，Uirj为在r组被试j对项目i的反应，设 ws为抄袭来源的错误项目数，对于每被试rj就有指示变量Airj，当第r组被试j对项目i的反应与抄袭来源s对项目i的反应相，Airj=1，，Airj =0，设Mrj为被试rj与抄袭来源s错误答案匹配的数目，，Mrj=ΣAirj，在计算k指数时是哪被试所对应的与抄袭来源的错误答案匹配数目是不必要的，将Mrj简记为M，用二项分布近似的估计M的分布，数学表达式如(1)式，
K=P(M≥mc′c)=∑wsg=mc′cwsgPc′g1－Pc′ws－g(1)
，ws为被怀疑的被抄者错误回答的数目，m c′c为被怀疑的抄袭者c′c与抄袭来源s匹配的错误选项数目，所以，k即是在偶然因素条件下的错误答案匹配比m c′c大的概率。当k值较小时，被怀疑抄袭者和抄袭间有着抄袭的可能性。在求k的中，Holland倡议用Qc′的分段线性回归来近似估计Pc′，但Pc′的估计值受到样本量的影响，在样本量小的情况下k的可靠性降低。 

1.3 k指数的扩展

Sotaridina、Meijer在k的上了新的抄袭统计量——k[KG*9]1、k[KG*9]2、s1。实际上，k[KG*9]1、k[KG*9]2在Pc′估计策略教学论文了改善，它们用一次函数和二次函数来估计Pc′；而s1对k系列指数的改善用泊松分布取代二项分布来估计M，并用对数线性函数估计泊松分布的参数。模拟实验探讨，s1、k[KG*9]2较k、k[KG*9]1的 I型错误率较低，抄袭识别率较高，s1比k[KG*9]2的抄袭识别率更高，，泊松分布能更好地估计M分布。 
2 以匹配正确回答数目和错误回答数目为的抄袭统计量

1[3][4]

事实上，抄袭统计量仅考虑被怀疑抄袭者和抄袭来源的错误回答匹配数目是有缺陷的。在浅析的匹配反应时将的正确匹配排除在外隐含了这样假设：只要被怀疑抄袭者和抄袭来源都选择了项目i的正确选项，就意味着被怀疑的抄袭者完全掌握项目i所考察的知识，但掌握项目i的被试还抄袭或猜测正确答案。探讨，只考虑被试的错误选项匹配的抄袭统计量对那些只以抄袭来源处抄袭正确答案的抄袭者检测效果迟钝，而在现实情景中却有着这样的情况：如，被怀疑抄袭者和抄袭来源是朋友，抄袭来源可能只将确定正确的那一答案给被怀疑抄袭者；又如，在具有作用小学数学教学论文的考试中，被怀疑抄袭者可能事先贿赂抄袭来源，让其为正确答案。Sotaridona等人正是基于这一考虑了以匹配正确回答数目和错误回答数目为的抄袭统计量s2，g2、ω等。

2.1 s2指数

在s2中新增了参数δ，其取值范围为\[0，1\]，用以描述被怀疑抄袭者和抄袭来源选择同一正确答案的情形。相应地，用Mrj*表示被试rj和抄袭来源匹配错误答案及匹配正确答案的总数，记为Mrj*=Mrj+Σδi*rj，，参数δi*rj是对被试rj在项目i*上掌握的量化，当被试rj知道项目i*的正确答案，该参数的值为0，而当被试rj完全不知道项目i*的答案时，该参数的值为1。Mrj*的值越大rj的抄袭可能性越大。地，当被试rj和抄袭来源s做对的项目全不，Σδi*rj=0，即有：Mrj*=Mrj；当被试rj和抄袭来源s间匹配的错误选项而只有着某些匹配的正确项目时，Mrj=0，Mrj*=Σδi*rj。，Mrj是被试rj与抄袭来源任何正确匹配情形下Mrj*的特殊形式，而s2建立在考虑了更多信息的Mrj*上，，该统计量较k扩展指标更实际情况。
s2的新增参数δ的求取被试rj在项目i*上的正确作答概率pi*rj，它用第r组被试正确作答项目i*的人数占总人数的比例来估计，然后，建立转换函数f(pi*rj)将正确作答概率转换成参数δ，该转换函数必需三个条件：1)当正确作答概率趋近1时，函数值趋于0；2)当正确作答概率趋近0时，函数值趋于1；3)两个考试所的项目具有不同选项数目，则所对应的转换函数设为f1、f2，，设它们所的选项数目为v1、v2，且 v1δi*rj=f(pi*rj)=d1ed2pi*rj ，d2=(－1+gg)，d1=(－1+g1－g)d2pi*rj(3)
f(pi*rj)是关于pi*rj的单调减函数，且含猜测概率g，所以该函数上述条件。前已述及，较二项分布而言，s1泊松分布能更好地估计M，，s2也用该分布来估计M*，并对数线性模型来估计其均值，如（4)式，
S2=Pr(M*≥m*c′c)=∑Iw=m*c′ce－μc′ΛμΛwc′w! ，μc′Λ=exp(β0+β1wc′)(4)
，I为考试所含的项目总数，wc′表示在子组c′被试答错的项目数，μc′Λ表示泊松分布的均值，同k指数。在已有的模拟探讨中，将s2的I型错误率和抄袭识别率与类抄袭指标比较，结果，在I型错误率，s1、k[KG*9]2略低于s2；在抄袭识别率，s2高于k、k[KG*9]2。 

2.2 g2指数

g2指数是被怀疑抄袭者和抄袭来源答案匹配的项目数hcs的标准化，，该抄袭指标的计算分两步：先求E(hcs)和σhcs 2，然后将其标准化。
1)一，假设抄袭来源的考试作答反应Us已知，则可确定被怀疑抄袭者和抄袭来源选择相同答案的概率pc(uis)，E(hcs)为在项目上的匹配概率之和。另一，被试对项目的回答正确和错误两种，，被怀疑抄袭者和抄袭来源的项目答案匹配服以二项分布，则σhcs 2为Σ\[pc(uis)\]\[1-pc(uis)\]；2)在E(hcs)和σhcs 2后即可求hcs的标准化结果Zhcs，即为g2。其数学表达式如(5)式，
g2=hcs－E(hcs|Us)σhcs|Us(5)
g2近以标准正态分布，，其值可用标准正态分布来性检验，g2值越大，c以s处抄袭答案的可能性就越大。在该抄袭统计量的计算中，pc(uis)的求取最为，，在经典测量论述(CTT)下，pc(uis)与项目i的难度、区分度及被怀疑的抄袭者在测验上的得分有关，还受参与该考试的被试在测验上的平均分的影响。，建立上的抄袭统计量g2避开地受到项目本身、被怀疑抄袭者的能力及参与考试的被试群体平均能力等多重因素的影响，干扰抄袭检测结果；另外，在计算pc(uis)的中，还有着低估选项的点二列及将测验项目和测验间的联系简单化等缺陷，这些都可能导致g2偏离正态分布。模拟探讨的结果也，该抄袭指标有较高的抄袭检测比率，但其I型错误率也较高，也说该指标趋于放松的估计，这在考试抄袭的检测是取的。

2.3 ω指数

前已述及，建立在CTT上的g2有着不尽如人意的地方，但其识别抄袭的思想无疑是值得推崇的，ω指数正是将g2的原理在IRT中运用而形成的考试抄袭统计量。来说，该抄袭指标用称名反应模型(Nominal Response Model，NRM)来估计被试在某项目上选择每个选项的概率，如6)式，
pik(θc)=exp(ζik+λikθc)∑Vv=1exp(ζiv+λivθc)(6)
（6)式中，V为第i个项目的选项个数，ζiv、λiv为第i题的第v个选项的难度和区分度，Pik(θc)为能力为θc的被怀疑抄袭者c在第i个项目上选择第k个选项的概率，被怀疑抄袭者的能力参数θc、项目参数(ζ、λ)可mutilog软件估计，以而Pik(θc)的值。实际上，在假定抄袭来源在i项目上的选择项是k的情况下，Pik(θc)表示被怀疑抄袭者和抄袭来源在第i个项目上选择了同一选项k的概率，，在该抄袭统计量的计算中，与g2指数的不同之处该指数NRM来计算被怀疑的抄袭者与抄袭来源选择相同答案的概率，在该概率后求取被怀疑抄袭者和抄袭来源选择相同答案数目hcs的期望和标准差及将hcs标准化的策略教学论文均与g2相同。Pik(θc)是在IRT下的，，Pik(θc)只与被怀疑抄袭者的能力及项目i所含选项的难度、区分度有关，而与参与该测验的被试群体的平均能力无关，这一点克服到了g2的，能给考试抄袭检测更可靠的信息。

2[3][4]

和g2一样，ω指数也近以标准正态分布，其值越大，被怀疑抄袭者确有抄袭的证据越。Wollack把该指数的含义分成6个等级：当c和s间的ω指数1等级(小于0)时，实际上了间不有着抄袭的统计证据；当ω指数2、3、4等级范围(大于0小于3.08)时，可将其c和s有着抄袭的证据，但在缺乏其他证据的情况下仍将被怀疑抄袭者判定为抄袭者，在该指数的值5、6等级(大于3.08)时，将被怀疑抄袭者判为抄袭已经具有强证据，可据此被试抄袭判断。
ω指数是探讨较多抄袭统计量。模拟探讨，该统计量的抄袭识别率受到被试样本的大小、测验长度、抄袭比率及I型错误率这四因素的影响。就被试样本而言，当被试人数大于100时，估计模型参数的所用被试人数的增加对识别率的影响不大，但在被试人数小于100时，将较好的参数估计值，进而影响了该指数的抄袭识别率；测验长度和c以s处的抄袭量是抄袭识别率的影响因素，抄袭识别率测验长度和抄袭比率的增加而提高，在c只抄了测验长度的10%～20%时，该指标识别出抄袭，尤其是在测验所含项目数较少的情况下；但当c抄袭的项目数占测验长度的30%时，ω指数能较好地识别抄袭；就I型错误率而言，抄袭识别率都I型错误率的提高而增加。
3 抄袭统计量的比较

3.1 关于测量论述

CTT所固有的被试得分、项目难度、区分度依赖于被试取样的缺陷，建立在CTT上s2和g2被怀疑抄袭者和抄袭来源间的实际作答方式概率变化而变化，还受到测验中其他考生的项目反应情况的干扰；而ω指数建立在IRT上，被怀疑抄袭者选择每个选项的概率只受他所具有的能力及项目难度、区分度的影响，与参与测验的其他被试无关，，较前两个统计量而言，ω指数能更真实地被怀疑抄袭者和抄袭来源间实际作答方式概率。

3.2 关于被怀疑抄袭者和抄袭来源间异常的回答方式确定策略教学论文

前已述及，抄袭统计量的原理是具有统计学作用小学数学教学论文的异常匹配回答方式来对有抄袭嫌疑的考生甄别。而异常匹配回答方式的确定策略教学论文有两类：一类是先建立该测验的被试和被怀疑的抄袭者做出相同回答方式的分布，然后将观察到的被怀疑抄袭者和抄袭来源做出匹配反应模型的概率与前者比较；另一类是将实际观察到的被怀疑抄袭者和抄袭来源匹配的反应方式与已知的论述分布比较。可知，三个兼顾正确回答匹配和错误回答匹配的抄袭识别统计量分属不同的种类：s2属于类，而g2及ω属于类。两类确定策略教学论文各弊：s2较后者更灵活，它不建立在任何假定的测量论述和论述分布上，但计算相对复杂，涉及到的估计参数较多；g2及ω较前者计算更简单，更易于理解，但g2、ω都建立在的测量论述上，并且它们都假定服以标准正态分布，这在上限制了这两个统计量的运用，在某些情况下，它们的值还可能偏离标准正态分布，以而使基于此的抄袭判断不准确。

3.3 关于考试抄袭检测效能

s2、g2、ω指数考虑被怀疑抄袭者和抄袭来源的正确答案匹配和错误答案匹配的抄袭统计量，但三者在抄袭检测效能有着差别。在情况下，g2将I型错误率制约小学语文教学论文在论述之下，也说该指标出现将未抄袭者虚报为抄袭者的错误，而这一错误在抄袭检测中会的后果。，该抄袭统计量只能在极端的实验条件下才具有较好的检测效果。ω指数具有良好的检测性能，而s2在与k系列指数的比较探讨中也具有优势，那么，这两个抄袭统计量的检测效能相比又如何呢？Sotaridina、Meijer 比较了ω指数和s2 指数的统计特性，模拟探讨被试样本量设计为2(100、500)，测验长度设计为2(40、80)，抄袭比率设计为4(10%、20%、30%、40%)，s能力(在第40%等级到90%等级之间随机选择)。探讨：1)在样本量为100的情况下，s2能将I型错误率制约小学语文教学论文在论述之下，但在样本量为500时，s2的I型错误率略高于论述；ω指数与s2的情况刚好相反；2)两个抄袭统计量的抄袭识别率都随抄袭比率的增加而增大；3)ω指数的抄袭识别率只与测验长度有关，不受样本大小影响，但s2 的抄袭识别率会测验长度和样本量的增加而提高；4)在抄袭比率较小(10%、20%)的情况下，不论测验长度及被试样本取值如何，s2的抄袭识别率都高于ω指数。这样的探讨结果也给抄袭识别运用探讨中如何选择抄袭统计量了的信息：当抄袭比率较小时可选择s2抄袭统计量，而当NRM项目参数能被精确估计出来或参加测验的其他考生信息时，ω指数是检测抄袭的最佳指标。
4 
的抄袭统计量以被怀疑抄袭者和被怀疑被抄者匹配回答的数目为的，k系列指数建立在被怀疑抄袭者和抄袭来源的错误选项匹配数目上，丢失了对抄袭识别的信息，使得这类仅考虑错误答案匹配的抄袭统计量在被怀疑抄袭者只抄袭正确答案的情景下反应并不灵敏。事实上，这样的情况在现实的测验情景中是可能发生的，在这样的现实情况下，要准确地抄袭识别就在考虑被怀疑抄袭者和抄袭来源错误匹配的考虑间的正确答案匹配数目，所的s2、g2、ω指数考虑了答案匹配的两种情况，较k指数考虑了更多有益于抄袭识别的信息，拓展了抄袭统计量的运用范围。
当然，抄袭统计量的运用预先观察确定被怀疑的抄袭者和抄袭来源，这导致了抄袭统计量在运用上依赖于对被试的现场观察的局限。，抄袭统计量是统计数值，，它和其他的统计策略教学论文一样是建立在概率论的上的，都有可能导致错误的统计推论，也说，即使两个独立被试有着某种异常反应方式的可能性很小，异常情况在现实中仍有可能是偶然因素所的，而并非抄袭所致。而将考生确定为将给考生的后果，，抄袭统计量只能识别被试抄袭的量化，在将被怀疑的抄袭者确定为抄袭者的中还应以多证据。
文献
韩丹，郭庆科，王昭，陈雪霞.(2008).考试抄袭识别的心理测量学探讨回顾.心理科学进展，16(1)，175-183.
Bay，L.G.(1995).Detection of cheating on multiple-choice tests examinations.Paper presented at the annual meeting of the American Educational Research Association，San Francisco.
Belov，I.D.，& Armstrong，R.D.(2010).Automatic detection of answer copying via kullback-leibler divergence and kindex.Applied Psychological Measurement，34(6)，379-392.

3[4]

Cizek，G.J.(1999).Cheating on tests：how to do it，detect it，and prevent it.Mahwah，NJ：Lawrence Erlbaum Associates.
Frary，R.B.(1997).Comparison of two indices of answer copying and development of a spliced index.Educational and Psychological Measurement，57(1)，20-32.
Holland，P.W.(1996).Assessing unusual agreement between the incorrect answers of two examinees using the kindex：Statistical theory and empirical support(ETS Research Report No.96-4).Princeton，NJ：Education Testing Service.
Lewis，C.，& Thayer，D.T.(1998).The power of the kindex to detect copying(ETS Research Report No.98-49).Princeton，NJ：Education Testing Service.
Sotaridona，L.S.(2003).Cheating detect using the s copying index.The Philippine Statistician，52，59-67.
Sotaridona，L.S.，& Meijer，R.R.(2002).Statistical properties of kindex for detecting answer copying.Journal of Educational Measurement，39，115-132.
Sotaridona，L.S.，& Meijer，R.R.(2003).Two new statistics to detect answer copying.Journal of Educational Measurement，40，53-69.
Sotaridona，L.S.，& Van der Linden，W.J.(2006).Detecting answer copying when the regular response process follows a known response model.Journal of Educational and Behioral Statistics，31(3)，283-304.
Sotaridona，L.S.，Van der Linden，W.J.，& Meijer，R.R.(2006).Detecting answer copying using the kappa statistic.Applied Psychological Measurement，30，412-431.
Wollack，J.A.(1997).A nominal response model approach for detecting answer copying.Applied Psychological Measurement，21，307-320.
Wollack，J.A.(2003).Comparison of answer copying indices with real data.Measurement in Education，40，189-205.
Wollack，J.A.(2004).Detecting answer copying on high-stakes tests.The Bar Examiner，73，35-45.

Review on the Research of Answer-copying Statistics based on the 
Matching Incorrect and Correct Answers
Gan Yuanyuan Tian Jinting Yu Jiayuan
(Psychology Department，Nanjing Normal University，Nanjing 210097)
Abstract：
Answer-copying statistics are especially presented to detect answer copying，and the likelihood of two examinees suspicion given the same answer pattern is calculated.According to the same answer pattern considered of two examinees，they could be classified two：the copying indices based solely on the matching incorrect answers and that based on both the matching correct answers and the matching incorrect answers.The first one is not sensitive to the copier who copies only the correct answers of the source，and the second one like s2，g2，and ω overcomes the limitation，which are different in three aspects：the measurement theory，the methods on determining the likelihood of two examinees given the same answer pattern and the detection power.Therefore，it is necessary to choose the appropriate copying index in practice.
Key words：answer-copying statistics；k-index；s2-index；g2-index；ω-index

[3]4