心理測量的幾個基本概念
來 源:網(wǎng)絡(luò)發(fā)表日期:2012-04-13
心理測量是一門科學。它有自己的一套嚴謹、系統(tǒng)和科學的研究方法。心理測量(psychological measurement)是通過科學、客觀、標準的測量手段對人的特定素質(zhì)進行測量、分析、評價。這里的所謂素質(zhì),是指那些完成特定工作或活動所需要或與之相關(guān)的感知、技能、能力、性格、興趣、動機等個人特征,它們是以一定的質(zhì)量和速度完成工作或活動的必要基礎(chǔ)。而心理測驗(psychological test)是心理測量的一種具體方法和手段,它是結(jié)合行為科學和數(shù)學方法,對某一特定個體在特定素質(zhì)上相對于特定群體所處的水平,進行測量的一種手段。
為了使大家能夠在較短的時間內(nèi)對心理測量這門科學有一個大概的了解,這里我們來介紹一下心理測量中的幾個最基本的重要概念。
信度
心理測量中所指的信度主要是指測量結(jié)果的可靠性或一致性。信度中比較常用的是重測信度,重測信度是指,用同一測驗,在不同時間對同一群體施測兩次,這兩次測驗分數(shù)的一致性(通常用相關(guān)系數(shù)來表示)。重測信度是衡量一個測驗的結(jié)果是否可靠的標準之一。比如,我們選用A測驗測查某一名被試的智商,第一次結(jié)果智商是100,而一個星期以后,我們用同樣的測驗對他進行第二次測驗,結(jié)果發(fā)現(xiàn)他的智商變成了140。若沒有極特殊的原因,一個人的智商是不可能在一周之內(nèi)發(fā)生如此大的變化的,由于兩次測量結(jié)果很不一致,我們就很難下結(jié)論說這名被試的智商究竟是多少。所以,在一般情況下,我們會認為這個測驗的重測信度很低,是不可信的。
信度是衡量任何測驗質(zhì)量的基本指標,一個測驗的信度較高,則說明它的分數(shù)是穩(wěn)定的、一致的,它的測量結(jié)果是可靠的。那么,信度多高才算合適呢?一般來說,當信度大于0.7時,可以將測驗結(jié)果進行不同團體間的比較;當信度大于0.85時,測驗結(jié)果才能應(yīng)用于個人之間的比較和評價,總得來說信度是越高越好。
效度
一個測驗光有信度還不夠,測驗分數(shù)是穩(wěn)定的,并不能說明它就能夠準確的測量想要測的特質(zhì)。比如一臺磅秤,長期使用,彈簧早已疲勞,一個100斤的人站上去,顯示的卻是110斤,一天稱10次,顯示的都是110斤,“信度”足夠好,但測得卻并一點都不準。由此,效度的概念應(yīng)運而生。
通俗的說,測量的效度就是指測量的有效性。一個測驗的效度越高,表明它所測得的結(jié)果就越能代表欲測特質(zhì)的真正水平。比如,一個智力測驗的效度比較高,我們就可以認為由這個測驗得出的分數(shù)可以比較準確的反映出完成測驗的人的真實的智力水平。
舉例來說,在人才招聘和選拔等管理實踐中,我們使用心理測驗的目的是希望它能預測被試將來的一些重要的外在行為(如工作業(yè)績),也就是說,我們關(guān)心的是:應(yīng)聘者在心理測驗中的得分能否有效的預測他在將來工作中的表現(xiàn),高分者是否一定將來表現(xiàn)優(yōu)異,低分者是否一定就表現(xiàn)糟糕,這就需要測驗具有較高的效度。
效度的種類有很多,有效標效度、內(nèi)容效度、構(gòu)想效度等等,限于篇幅,這里不一一介紹,感興趣的讀者可以查閱心理測量學的專業(yè)書籍。
測驗的標準化
一個人在心理測驗中的表現(xiàn),不僅決定于自身固有的素質(zhì),有時還會受到許多與測驗無關(guān)的因素的影響。比如考場環(huán)境、主考官的指導語、評分者的水平等等。為了使測驗的結(jié)果更加準確、可靠,減少誤差,我們就要在測驗實施的過程中盡量控制無關(guān)因素對測驗的影響,使測驗分數(shù)能夠真正反映一個人真實的能力水平。這個控制的過程,稱作標準化。測驗的標準化包括以下幾個方面:
內(nèi)容標準化:即對所有被試施測相同的題目。測驗的內(nèi)容不同,所得的測驗分數(shù)是無法相互比較的。
施測過程標準化:首先,無論在何時何地給何人施測,主考官宣讀的測驗指導語必須完全一致。第二,測驗的時間要統(tǒng)一、嚴格控制,這一點對能力測驗尤為重要。在本章稍后給出的案例中,對施測過程的標準化將有更加具體、詳細的介紹。
評分標準化:即客觀評分。對于那些需要主觀評分的測驗,要求至少有兩個以上受過專業(yè)訓練的評分者同時評分,而且他們的分數(shù)必須具有一致性。
常模:一個標準化的測驗,不但內(nèi)容、施測和評分要標準化,對分數(shù)的解釋也必須標準化。一個測驗的原始分數(shù)本身并不具有任何可比性。在傳統(tǒng)的心理測驗中,把個人所得的分數(shù)與代表一般人同類行為水平的分數(shù)分布情況相比較,以判別其所得分數(shù)的高低。此處所指的“代表一般人同類行為的分數(shù)的分布情況”,即稱為“常模”。
建立常模的方法是,在將來要使用測驗的全體對象中,選擇有代表性的一部分人(稱標準化樣本),對此樣本施測并將所得的分數(shù)加以統(tǒng)計整理,得出一個具有代表性的分數(shù)分布,這個分布就被稱為常模。常??梢驑藴驶瘯r選取樣本的不同而有不同的類別,形成不同的亞常模。常見的亞常模有年齡常模、年級常模、性別常模、地域常模、民族常模、職業(yè)常模等。
- 相關(guān)文章
-