心理測(cè)量的幾個(gè)基本概念
來(lái) 源:網(wǎng)絡(luò)發(fā)表日期:2012-04-13
心理測(cè)量是一門科學(xué)。它有自己的一套嚴(yán)謹(jǐn)、系統(tǒng)和科學(xué)的研究方法。心理測(cè)量(psychological measurement)是通過科學(xué)、客觀、標(biāo)準(zhǔn)的測(cè)量手段對(duì)人的特定素質(zhì)進(jìn)行測(cè)量、分析、評(píng)價(jià)。這里的所謂素質(zhì),是指那些完成特定工作或活動(dòng)所需要或與之相關(guān)的感知、技能、能力、性格、興趣、動(dòng)機(jī)等個(gè)人特征,它們是以一定的質(zhì)量和速度完成工作或活動(dòng)的必要基礎(chǔ)。而心理測(cè)驗(yàn)(psychological test)是心理測(cè)量的一種具體方法和手段,它是結(jié)合行為科學(xué)和數(shù)學(xué)方法,對(duì)某一特定個(gè)體在特定素質(zhì)上相對(duì)于特定群體所處的水平,進(jìn)行測(cè)量的一種手段。
為了使大家能夠在較短的時(shí)間內(nèi)對(duì)心理測(cè)量這門科學(xué)有一個(gè)大概的了解,這里我們來(lái)介紹一下心理測(cè)量中的幾個(gè)最基本的重要概念。
信度
心理測(cè)量中所指的信度主要是指測(cè)量結(jié)果的可靠性或一致性。信度中比較常用的是重測(cè)信度,重測(cè)信度是指,用同一測(cè)驗(yàn),在不同時(shí)間對(duì)同一群體施測(cè)兩次,這兩次測(cè)驗(yàn)分?jǐn)?shù)的一致性(通常用相關(guān)系數(shù)來(lái)表示)。重測(cè)信度是衡量一個(gè)測(cè)驗(yàn)的結(jié)果是否可靠的標(biāo)準(zhǔn)之一。比如,我們選用A測(cè)驗(yàn)測(cè)查某一名被試的智商,第一次結(jié)果智商是100,而一個(gè)星期以后,我們用同樣的測(cè)驗(yàn)對(duì)他進(jìn)行第二次測(cè)驗(yàn),結(jié)果發(fā)現(xiàn)他的智商變成了140。若沒有極特殊的原因,一個(gè)人的智商是不可能在一周之內(nèi)發(fā)生如此大的變化的,由于兩次測(cè)量結(jié)果很不一致,我們就很難下結(jié)論說(shuō)這名被試的智商究竟是多少。所以,在一般情況下,我們會(huì)認(rèn)為這個(gè)測(cè)驗(yàn)的重測(cè)信度很低,是不可信的。
信度是衡量任何測(cè)驗(yàn)質(zhì)量的基本指標(biāo),一個(gè)測(cè)驗(yàn)的信度較高,則說(shuō)明它的分?jǐn)?shù)是穩(wěn)定的、一致的,它的測(cè)量結(jié)果是可靠的。那么,信度多高才算合適呢?一般來(lái)說(shuō),當(dāng)信度大于0.7時(shí),可以將測(cè)驗(yàn)結(jié)果進(jìn)行不同團(tuán)體間的比較;當(dāng)信度大于0.85時(shí),測(cè)驗(yàn)結(jié)果才能應(yīng)用于個(gè)人之間的比較和評(píng)價(jià),總得來(lái)說(shuō)信度是越高越好。
效度
一個(gè)測(cè)驗(yàn)光有信度還不夠,測(cè)驗(yàn)分?jǐn)?shù)是穩(wěn)定的,并不能說(shuō)明它就能夠準(zhǔn)確的測(cè)量想要測(cè)的特質(zhì)。比如一臺(tái)磅秤,長(zhǎng)期使用,彈簧早已疲勞,一個(gè)100斤的人站上去,顯示的卻是110斤,一天稱10次,顯示的都是110斤,“信度”足夠好,但測(cè)得卻并一點(diǎn)都不準(zhǔn)。由此,效度的概念應(yīng)運(yùn)而生。
通俗的說(shuō),測(cè)量的效度就是指測(cè)量的有效性。一個(gè)測(cè)驗(yàn)的效度越高,表明它所測(cè)得的結(jié)果就越能代表欲測(cè)特質(zhì)的真正水平。比如,一個(gè)智力測(cè)驗(yàn)的效度比較高,我們就可以認(rèn)為由這個(gè)測(cè)驗(yàn)得出的分?jǐn)?shù)可以比較準(zhǔn)確的反映出完成測(cè)驗(yàn)的人的真實(shí)的智力水平。
舉例來(lái)說(shuō),在人才招聘和選拔等管理實(shí)踐中,我們使用心理測(cè)驗(yàn)的目的是希望它能預(yù)測(cè)被試將來(lái)的一些重要的外在行為(如工作業(yè)績(jī)),也就是說(shuō),我們關(guān)心的是:應(yīng)聘者在心理測(cè)驗(yàn)中的得分能否有效的預(yù)測(cè)他在將來(lái)工作中的表現(xiàn),高分者是否一定將來(lái)表現(xiàn)優(yōu)異,低分者是否一定就表現(xiàn)糟糕,這就需要測(cè)驗(yàn)具有較高的效度。
效度的種類有很多,有效標(biāo)效度、內(nèi)容效度、構(gòu)想效度等等,限于篇幅,這里不一一介紹,感興趣的讀者可以查閱心理測(cè)量學(xué)的專業(yè)書籍。
測(cè)驗(yàn)的標(biāo)準(zhǔn)化
一個(gè)人在心理測(cè)驗(yàn)中的表現(xiàn),不僅決定于自身固有的素質(zhì),有時(shí)還會(huì)受到許多與測(cè)驗(yàn)無(wú)關(guān)的因素的影響。比如考場(chǎng)環(huán)境、主考官的指導(dǎo)語(yǔ)、評(píng)分者的水平等等。為了使測(cè)驗(yàn)的結(jié)果更加準(zhǔn)確、可靠,減少誤差,我們就要在測(cè)驗(yàn)實(shí)施的過程中盡量控制無(wú)關(guān)因素對(duì)測(cè)驗(yàn)的影響,使測(cè)驗(yàn)分?jǐn)?shù)能夠真正反映一個(gè)人真實(shí)的能力水平。這個(gè)控制的過程,稱作標(biāo)準(zhǔn)化。測(cè)驗(yàn)的標(biāo)準(zhǔn)化包括以下幾個(gè)方面:
內(nèi)容標(biāo)準(zhǔn)化:即對(duì)所有被試施測(cè)相同的題目。測(cè)驗(yàn)的內(nèi)容不同,所得的測(cè)驗(yàn)分?jǐn)?shù)是無(wú)法相互比較的。
施測(cè)過程標(biāo)準(zhǔn)化:首先,無(wú)論在何時(shí)何地給何人施測(cè),主考官宣讀的測(cè)驗(yàn)指導(dǎo)語(yǔ)必須完全一致。第二,測(cè)驗(yàn)的時(shí)間要統(tǒng)一、嚴(yán)格控制,這一點(diǎn)對(duì)能力測(cè)驗(yàn)尤為重要。在本章稍后給出的案例中,對(duì)施測(cè)過程的標(biāo)準(zhǔn)化將有更加具體、詳細(xì)的介紹。
評(píng)分標(biāo)準(zhǔn)化:即客觀評(píng)分。對(duì)于那些需要主觀評(píng)分的測(cè)驗(yàn),要求至少有兩個(gè)以上受過專業(yè)訓(xùn)練的評(píng)分者同時(shí)評(píng)分,而且他們的分?jǐn)?shù)必須具有一致性。
常模:一個(gè)標(biāo)準(zhǔn)化的測(cè)驗(yàn),不但內(nèi)容、施測(cè)和評(píng)分要標(biāo)準(zhǔn)化,對(duì)分?jǐn)?shù)的解釋也必須標(biāo)準(zhǔn)化。一個(gè)測(cè)驗(yàn)的原始分?jǐn)?shù)本身并不具有任何可比性。在傳統(tǒng)的心理測(cè)驗(yàn)中,把個(gè)人所得的分?jǐn)?shù)與代表一般人同類行為水平的分?jǐn)?shù)分布情況相比較,以判別其所得分?jǐn)?shù)的高低。此處所指的“代表一般人同類行為的分?jǐn)?shù)的分布情況”,即稱為“常模”。
建立常模的方法是,在將來(lái)要使用測(cè)驗(yàn)的全體對(duì)象中,選擇有代表性的一部分人(稱標(biāo)準(zhǔn)化樣本),對(duì)此樣本施測(cè)并將所得的分?jǐn)?shù)加以統(tǒng)計(jì)整理,得出一個(gè)具有代表性的分?jǐn)?shù)分布,這個(gè)分布就被稱為常模。常模可因標(biāo)準(zhǔn)化時(shí)選取樣本的不同而有不同的類別,形成不同的亞常模。常見的亞常模有年齡常模、年級(jí)常模、性別常模、地域常模、民族常模、職業(yè)常模等。
- 相關(guān)文章
-