數據論 每天都在統計數據,數據去死吧……(1 / 2)

工作與妄想 不圓的珍珠 1743 字 10個月前

忘了是辦公室裡誰在Q空間裡說的,我們每天不停地總結數據報告數據隻是表達了一個問題:自瑪雅人第一次把天文學圖像刻在石板上至今,人類對於記錄這種事情已經產生了一種偏執情緒。

我個人深以為然,就如同那隻住在我意識最深處的惡魔所言:數據也是一種陳堂證供。不過同時我也覺得一定一定不可以讓同事看到我的日記……

不管怎麼說,基於上文提到的(忘了是誰提到的)那種偏執情緒,完全相同的數據,在分析統計的名義下日複一日地被反複傳抄,從我和俞蕭美女這種級彆的技術人員到長腿叔叔(*),到我們的特留尼希特部長(*),再到那些能夠決定給不給我發薪水的大人物(*)。而在那種看起來十分重要的會議上,全部這些數據的分析過程就是“總數……不良……合格……”照應如此簡單的分析過程,分析結果也自然十分直截了當——生產中不良過多,你們設法解決。

(*和*和*,給不知道長腿叔叔、特留尼西特和大人物的人,他們日後正式出場的時候我會隆重介紹的。)

這是個令我百思不得其解的有趣現象:既然被稱為“統計與分析”的這個過程是如此的明了,如此的易於理解,那麼在記錄數據的時候那種經過嵌套又嵌套之後無比艱深的excel表格又有是派什麼用場的呢?而表格裡那些充滿了@#$%^&*的、與最古老的煉金術配方不相上下的函數和公式又是派什麼用場的呢?我甚至從來不曾在援引了那些數據報告的場合遇見一個和藹可親的“%”出場(這麼說來,分布圖和條形圖也都沒有出現過,它們就像大白天穿過辦公室地板的老鼠一樣默默地一溜小跑消失在回收站的最深處)。

在經曆了很長一段時間之後,我覺得事情或許可以這樣解釋:一份數據,它正確與否其實完全不重要,因為最終最終將要在某個大會上看數據的人根本就不能確定這份數據表達的事件是否存在,而且也懶得確定它是否存在。當然了,因為絕大多數時候(至少是在我們公司)數據表達的所有事件都是真實存在的。所以說,數據這個東西,它的重點不在於準確,而在於——看起來像那麼回事。所以,比較有策略地說,善於利用數據表達自己的心情一定受益良多。但是正因為如此,數據的總結才應該更簡潔才是,因為言辭簡潔是有才能的人的特征之一,哪怕是最一本正經的英文文獻也不會弄出七重的定語從句來。

因此,對於嵌套之嵌套的excel表格,也許隻能用如下假說來解釋: