在開(kāi)始玩“猜相關(guān)”之前,我從沒(méi)想過(guò)自己會(huì)把復(fù)活節(jié)假期的一小時(shí)花在沉迷一個(gè)8比特游戲上,更不用說(shuō)它還是個(gè)關(guān)于許多科學(xué)家的日常工作的游戲了。同樣,我也從未想過(guò)自己會(huì)淪陷于一張張黑點(diǎn)組成的圖形中,力圖準(zhǔn)確地估計(jì)出這些黑點(diǎn)背后隱藏的規(guī)律,從而獲得分?jǐn)?shù)、榮登游戲排行榜。而且我也絕對(duì)沒(méi)有指望過(guò)這件事會(huì)很好玩。
“猜相關(guān)”是奧馬爾?瓦基(Omar Wagih)的智力結(jié)晶,他是歐洲生物信息研究所的一位研究生,并且是我的(曾經(jīng)是閑暇)時(shí)間的邪惡吞噬者。這個(gè)游戲文字描述起來(lái)極端無(wú)聊,然而一旦開(kāi)玩就根本停不下來(lái)。 不信試試看。
游戲中,玩家會(huì)看到許多散點(diǎn)圖——一種用于展示兩事物間關(guān)系的常見(jiàn)圖表,它反應(yīng)的可能是氣溫和冰淇淋銷量的關(guān)系,或者是體重和心臟病患病風(fēng)險(xiǎn)的關(guān)系,也可能是你花在這個(gè)邪惡游戲上的時(shí)間和你朋友數(shù)量的關(guān)系。你需要做的就是盯著這些散點(diǎn)圖看,并估計(jì)出一個(gè)被稱作R值的值,R體現(xiàn)了兩事物間的相關(guān)性。在這個(gè)游戲中,R的取值范圍是0(完全沒(méi)有相關(guān)性)到1(完美的正相關(guān))。
先來(lái)復(fù)習(xí)一下不同R(相關(guān)系數(shù))對(duì)應(yīng)的散點(diǎn)圖。
通過(guò)觀察散點(diǎn)圖來(lái)判斷事物之間的相關(guān)性是科學(xué)家們一直在做的事。在游戲過(guò)程中,我發(fā)現(xiàn)這件事出乎意料地困難。強(qiáng)相關(guān)(比如當(dāng)R大于0.8時(shí))十分明顯,因?yàn)辄c(diǎn)都排成了一條干凈的斜線。類似地,弱相關(guān)(當(dāng)R小于0.2時(shí))的圖形看起來(lái)就像盲人射手練習(xí)射擊后的靶子。然而,在這兩者之間還存在著巨大的中間地帶,我的判斷力通常在這里戲劇般地下線——這也正是瓦基設(shè)計(jì)這個(gè)游戲的初衷。
去年十二月,瓦基參加了一場(chǎng)研討會(huì),會(huì)上,一位發(fā)言人展示了一張散點(diǎn)圖,并斷言這其中存在相關(guān)性?!八雌饋?lái),你知道,并不是怎么相關(guān),”瓦基說(shuō)?!拔揖拖?,我應(yīng)該把他的話當(dāng)真么?之后,他給我看了R值,R值顯示這其中確實(shí)存在相關(guān)性,而我低估了散點(diǎn)圖中的信息。我意識(shí)到會(huì)這樣做的人可能不只我一個(gè)。”
他找到了幾個(gè)可以隨機(jī)生成散點(diǎn)圖猜R值的網(wǎng)站,但“這些網(wǎng)站都很無(wú)聊,”他說(shuō),“完全沒(méi)有動(dòng)力驅(qū)使你繼續(xù)下去。就這樣,我產(chǎn)生了做個(gè)游戲的想法?!?/SPAN>
游戲機(jī)制非常簡(jiǎn)單,由極簡(jiǎn)主義的設(shè)計(jì)和懷舊音樂(lè)實(shí)現(xiàn)。猜一連串散點(diǎn)圖的R值,差太多會(huì)丟一條命,猜很準(zhǔn)可以獎(jiǎng)勵(lì)一條命。比較好的估計(jì)可以為你贏得金幣,這會(huì)計(jì)入你的最終得分。你甚至可以和朋友比賽。這就是這個(gè)游戲的全部。
為了展示游戲界面開(kāi)了游戲,一上手就丟命_(:з」∠)_圖片來(lái)源:guessthecorrelation.com
瓦基于去年12月上線了這個(gè)游戲,并將每個(gè)玩家的估計(jì)數(shù)據(jù)收集成了一個(gè)數(shù)據(jù)庫(kù)。他打算分析這些數(shù)據(jù),來(lái)看看蒙蔽人們的散點(diǎn)圖中是否存在著某些視覺(jué)因素,讓人們高估或者低估相關(guān)性?!斑@種事以前就有人做過(guò),但現(xiàn)在的重點(diǎn)在于我有龐大的數(shù)據(jù),”他說(shuō)。其他的研究一般僅涉及幾十個(gè)志愿者和幾千個(gè)估計(jì)值。但到今年三月中旬,瓦基已擁有 17萬(wàn)名注冊(cè)玩家和一個(gè)有著 超過(guò)400萬(wàn)估計(jì)值的數(shù)據(jù)庫(kù)。
“我想設(shè)計(jì)一個(gè)更復(fù)雜的游戲,更讓人上癮的,”瓦基說(shuō)(上帝啊饒了我吧)。他打算增加難度等級(jí),改變散點(diǎn)的數(shù)量或大?。ㄇ蠓胚^(guò)!)?!拔蚁胱龀鲆粋€(gè)你無(wú)聊時(shí)會(huì)在手機(jī)上玩的主流游戲,這樣你就不會(huì)意識(shí)到自己是在猜相關(guān)性,并且在給這個(gè)研究課題做出貢獻(xiàn)?!保熳∈郑。。?/SPAN>
“我自己玩這個(gè)游戲的時(shí)間已經(jīng)比我應(yīng)該投入得多了,”他補(bǔ)充道?!拔視?huì)坐在朋友身邊,看他們輸入答案,然后說(shuō)‘不對(duì),不對(duì),是0.72’。他們不相信我,但我的答案往往更加接近。”
除了看別人猜相關(guān)之外,他的經(jīng)歷證明這個(gè)游戲作為訓(xùn)練工具,有著提高研究者判斷相關(guān)性能力的潛力?!斑@是首要的目的,”瓦基說(shuō)?!拔?guī)缀趺刻於紩?huì)接觸到這樣的散點(diǎn)圖,可能是我自己的,也可能是我讀到的論文里的。如果它能訓(xùn)練你下意識(shí)辨認(rèn)出散點(diǎn)圖中對(duì)相關(guān)性有貢獻(xiàn)的結(jié)構(gòu)或特征,這會(huì)非常有用?!?/SPAN>
可視化能幫助我們理解大量數(shù)據(jù),但它們?nèi)匀挥兄陨淼娜毕荩赡軙?huì)讓人們誤入歧途。信息是美麗的,但美麗本身也有欺騙性?!白鳛橐粋€(gè)研究者,你要閱讀大量文獻(xiàn),在很多情況下,你只會(huì)看圖,而不會(huì)看文字?!彼f(shuō)?!澳憧匆?jiàn)了一張圖——甚至可能是你自己的圖——然后據(jù)此做出了某種判斷。與一般人所想的相反,人們并不怎么擅長(zhǎng)這件事。而我已經(jīng)有了數(shù)據(jù)來(lái)證明這一點(diǎn)?!?/SPAN>