2013-10-07

【主場新聞】劉笑敢:看透數字之魔 — 談大學排名之荒謬所在 (591)

近年來我常思考現代文明的發展問題,所以看書比較雜。中國有中國的問題,美國有美國的問題,各國都有些麻煩。這些問題既是由每個國家自己的歷史造成的,也是全球化潮流帶來的,比如中國的教育問題、醫療改革問題。這些屬於中國自身的問題,有中國自身的特點和原因,但是跟全球化的總趨勢也是連在一起的,與之有一致性、共同性,雖然二者不完全一樣。所以比較複雜。

專家們一直在討論這些問題,但他們往往從自己的專業角度考慮、分析問題,缺乏宏觀、全局的視野。比如現在最主要的價值是成功,而成功往往意味着實際利益或者經濟效益,特別是經濟效益,而經濟效益又表現爲數字,所以數字化的東西不僅僅在經濟領域,甚至在各個領域都有表現,國與國之間、政府之間、官員之間的事都要數字化,在教育領域表現得尤其明顯。

這個趨勢危害蠻大的。我並不籠統反對數字化,量化管理有其特殊功能。但量化管理最早是從工商業中産生的,隨着經濟生活在人類社會中越來越重要,商業量化管理的模式幾乎推廣到全球各個領域。往往越是落後的地區越是迷信數字效益。在教育領域,評價一個學校就是打分,用分數來評比,誰分數高誰就是好學校。後發展中國家原來不太好的學校遵從量化標準去追趕名牌學校,着眼於數字化的目標和任務。名牌學校是在幾百年的傳承中形成的,有豐富的內涵,現在把它簡化爲某種量化標準,誤導很厲害。

其實,量化管理是數字迷信,數字迷信得以出現是因爲它似乎很「科學」,運用了很多數據,而數據是科學研究的一個基本元素,沒有數據就沒有科學。現在把數字在科學中的重要性無限地擴大,導致求真、求實的基本的科學精神喪失殆盡。從政府到學校,教授、學生、家長關注的都是數字。GDP、支持率、得票率、排名名次、考試分數、研究經費數量等等主宰了大家思考、關心的基本方向,一些根本和重要的東西反而變得可有可無。這其實是非常荒謬的。荒謬的原因是它假冒科學的名義。真正的科學家知道數字的適用度和局限性。數字在特定領域裏有特定價值,把它放大到所有領域,作爲對於大學的衡量指標、對國家的衡量指標、對人的衡量指標,很荒謬。

我看到美國一位記者寫的一篇文章(“The Order of Things:What College Rankings Really Tell Us”,載The New Yorker, 2011年2月14日),談美國大學的排名。文章中說到,《美國新聞與世界報導》每年都給美國大學排名。在接受記者採訪時,該機構成員提到,「我們從來沒有說過我們是科學家,我們也從來沒有說過我們的排名是經過了同行的認可,我們只是參考他們的意見。」這個排名影響很大,但也有荒謬之處。荒謬在哪裏?因爲不可能客觀。只有可比的數值相比才有客觀意義,你是一米六,我是一米五,你比我高是客觀的;你一百八十斤,我一百六十斤,這也是客觀的;奧林匹克比賽誰跑得快、誰跑得慢,這也是客觀的。這些是單項的、可量度的比較,有客觀標準。但是如果進行綜合比較,拿姚明跟劉翔比誰更好,根本沒辦法比。現在大學排名重視的指標,多有利於私立、名牌、昂貴的大學,而沒有考慮到學生的付出和獲得之間的比,即所謂「性價比」。而一考慮這個,有些大學的排名就會大大靠前,而不是那些學費昂貴的學校。

但是現在從事管理的人,包括一些政府部門,都把量化看得很神聖、很科學。要評一個大學的好壞就得打分,但打分有各種各樣的指標,比如總財政水平、年度經費、論文發表數量、學生畢業後工資、教授國際聲譽等等,這些不同的標準重視的角度不同,採用的數據不同,不同數據所占的比例不同。有的大學在這個排名體係裏處在前三十位,到另一個排名體係裏可能跌到一二百位。現在社會盲目迷信數字,專家也迷信數字,校長說他們被排名逼得很苦。如果排名上不去,學生不來報考,學校生意很差,校長就沒有做好。香港有個大學校長一上任就說:「我爭取在幾年之內讓我們大學的排名進入前一百名」,結果剛過兩三天另一個排名出來了,他們什麽都還沒有做,已經在一百名之內了。有什麽意義?

那篇文章提到密西根高等法院的一位法官向同行律師們發了上百份問卷,請被調查者列出美國最好的十個法學院,其中賓夕法尼亞大學法學院排在十名的中間,是很高的排名。但實際上,那時候賓夕法尼亞大學沒還有法學院。這說明這些填問卷的人根本就沒有去了解、調查,就以爲賓夕法尼亞大學法學院不錯,因爲他們主觀上認爲賓夕法尼亞大學應該在前10名,他們實際上受了原有排名的引導。這說明同行、專家對所謂「知名度」(reputation)的打分也可能是很荒謬的。我也收到過類似的問卷,我都不理,因爲這種調查很盲目,沒有實際意義。

專家對同行的評價往往受過去排名的影響,沒有幾個人真的去那個大學考察、調查過,就作出評價,這就是誤導加誤導。但是大學校長、教育部門、家長都相信排名,排名機構說「我考慮得很複雜、很全面,各種因素都考慮了,我們的排名是很客觀的」。其實不可能客觀。舉一個例子。比如我們要評哪種動物最有價值,或者哪種動物對人類最有意義,從而確定應該首先保護哪種動物。那麽,哪種動物對人來說最重要呢?狗忠誠,猴子靈活,大猩猩智力最接近人類,大象耐力最好。假設我們只從這四種中選出最好的動物,從而確定我們人類應該最重視哪種動物。如果靈活性、智力高、耐力好和接近人類智力這四項標準中,各占25%,那麽這四種動物的排名是一樣的,絕對分不出高下。但是,如果我更傾向於靈活性,給靈活性較高權重,那猴子肯定贏;如果我認爲智力更重要,那就是大猩猩名列前茅;我更傾向於耐力,那就是大象。怎麽能做到客觀呢?你給哪一個標準定的百分比高,哪一種動物就自然勝出。既然評分標準不客觀,最後的結果也不可能客觀。很多不客觀的項目評分加在一起變得很複雜,但同樣不可能客觀。所謂科學、客觀、全面的統計其實是片面、主觀的。現在很多人那麽重視大學排名,就是沒有看到這背後的荒謬性,我所看的這篇文章就揭露了這一點。其實不僅大學排名,很多領域都採用了類似「科學」的量化標準,專家們知道這些統計數據的有限性,不會盲目運用這些「數據」,但一般政府、學校、管理者都迷信這些來源不明、不可靠的「數據」,其結果是一葉障目,脫離社會實際,甚至南轅北轍,還自鳴得意。所以,我們應該看透這些「數據」的魔障。



原文連結