在開始玩“猜相關(guān)”之前,我從沒想過自己會把復(fù)活節(jié)假期的一小時花在沉迷一個8比特游戲上,更不用說它還是個關(guān)于許多科學(xué)家的日常工作的游戲了。同樣,我也從未想過自己會淪陷于一張張黑點(diǎn)組成的圖形中,力圖準(zhǔn)確地估計出這些黑點(diǎn)背后隱藏的規(guī)律,從而獲得分?jǐn)?shù)、榮登游戲排行榜。而且我也絕對沒有指望過這件事會很好玩。
“猜相關(guān)”是奧馬爾?瓦基(Omar Wagih)的智力結(jié)晶,他是歐洲生物信息研究所的一位研究生,并且是我的(曾經(jīng)是閑暇)時間的邪惡吞噬者。這個游戲文字描述起來極端無聊,然而一旦開玩就根本停不下來。 不信試試看。
游戲中,玩家會看到許多散點(diǎn)圖——一種用于展示兩事物間關(guān)系的常見圖表,它反應(yīng)的可能是氣溫和冰淇淋銷量的關(guān)系,或者是體重和心臟病患病風(fēng)險的關(guān)系,也可能是你花在這個邪惡游戲上的時間和你朋友數(shù)量的關(guān)系。你需要做的就是盯著這些散點(diǎn)圖看,并估計出一個被稱作R值的值,R體現(xiàn)了兩事物間的相關(guān)性。在這個游戲中,R的取值范圍是0(完全沒有相關(guān)性)到1(完美的正相關(guān))。
先來復(fù)習(xí)一下不同R(相關(guān)系數(shù))對應(yīng)的散點(diǎn)圖。
通過觀察散點(diǎn)圖來判斷事物之間的相關(guān)性是科學(xué)家們一直在做的事。在游戲過程中,我發(fā)現(xiàn)這件事出乎意料地困難。強(qiáng)相關(guān)(比如當(dāng)R大于0.8時)十分明顯,因?yàn)辄c(diǎn)都排成了一條干凈的斜線。類似地,弱相關(guān)(當(dāng)R小于0.2時)的圖形看起來就像盲人射手練習(xí)射擊后的靶子。然而,在這兩者之間還存在著巨大的中間地帶,我的判斷力通常在這里戲劇般地下線——這也正是瓦基設(shè)計這個游戲的初衷。
去年十二月,瓦基參加了一場研討會,會上,一位發(fā)言人展示了一張散點(diǎn)圖,并斷言這其中存在相關(guān)性?!八雌饋恚阒溃⒉皇窃趺聪嚓P(guān),”瓦基說?!拔揖拖耄覒?yīng)該把他的話當(dāng)真么?之后,他給我看了R值,R值顯示這其中確實(shí)存在相關(guān)性,而我低估了散點(diǎn)圖中的信息。我意識到會這樣做的人可能不只我一個?!?/SPAN>
他找到了幾個可以隨機(jī)生成散點(diǎn)圖猜R值的網(wǎng)站,但“這些網(wǎng)站都很無聊,”他說,“完全沒有動力驅(qū)使你繼續(xù)下去。就這樣,我產(chǎn)生了做個游戲的想法。”
游戲機(jī)制非常簡單,由極簡主義的設(shè)計和懷舊音樂實(shí)現(xiàn)。猜一連串散點(diǎn)圖的R值,差太多會丟一條命,猜很準(zhǔn)可以獎勵一條命。比較好的估計可以為你贏得金幣,這會計入你的最終得分。你甚至可以和朋友比賽。這就是這個游戲的全部。
為了展示游戲界面開了游戲,一上手就丟命_(:з」∠)_圖片來源:guessthecorrelation.com
瓦基于去年12月上線了這個游戲,并將每個玩家的估計數(shù)據(jù)收集成了一個數(shù)據(jù)庫。他打算分析這些數(shù)據(jù),來看看蒙蔽人們的散點(diǎn)圖中是否存在著某些視覺因素,讓人們高估或者低估相關(guān)性?!斑@種事以前就有人做過,但現(xiàn)在的重點(diǎn)在于我有龐大的數(shù)據(jù),”他說。其他的研究一般僅涉及幾十個志愿者和幾千個估計值。但到今年三月中旬,瓦基已擁有 17萬名注冊玩家和一個有著 超過400萬估計值的數(shù)據(jù)庫。
“我想設(shè)計一個更復(fù)雜的游戲,更讓人上癮的,”瓦基說(上帝啊饒了我吧)。他打算增加難度等級,改變散點(diǎn)的數(shù)量或大?。ㄇ蠓胚^?。??!拔蚁胱龀鲆粋€你無聊時會在手機(jī)上玩的主流游戲,這樣你就不會意識到自己是在猜相關(guān)性,并且在給這個研究課題做出貢獻(xiàn)?!保熳∈郑。。?/SPAN>
“我自己玩這個游戲的時間已經(jīng)比我應(yīng)該投入得多了,”他補(bǔ)充道?!拔視谂笥焉磉?,看他們輸入答案,然后說‘不對,不對,是0.72’。他們不相信我,但我的答案往往更加接近?!?/SPAN>
除了看別人猜相關(guān)之外,他的經(jīng)歷證明這個游戲作為訓(xùn)練工具,有著提高研究者判斷相關(guān)性能力的潛力?!斑@是首要的目的,”瓦基說。“我?guī)缀趺刻於紩佑|到這樣的散點(diǎn)圖,可能是我自己的,也可能是我讀到的論文里的。如果它能訓(xùn)練你下意識辨認(rèn)出散點(diǎn)圖中對相關(guān)性有貢獻(xiàn)的結(jié)構(gòu)或特征,這會非常有用?!?/SPAN>
可視化能幫助我們理解大量數(shù)據(jù),但它們?nèi)匀挥兄陨淼娜毕荩赡軙屓藗冋`入歧途。信息是美麗的,但美麗本身也有欺騙性。“作為一個研究者,你要閱讀大量文獻(xiàn),在很多情況下,你只會看圖,而不會看文字。”他說?!澳憧匆娏艘粡垐D——甚至可能是你自己的圖——然后據(jù)此做出了某種判斷。與一般人所想的相反,人們并不怎么擅長這件事。而我已經(jīng)有了數(shù)據(jù)來證明這一點(diǎn)。”