話說統計


"在蒙特卡羅玩輪盤睹一個月的記錄,可以成為討論知識源泉的資料."
    -- Karl Pearson

統計,可以提供很多很多訊息,運用不當也可能提供很多無用的訊息.

從遠古人們結繩記數,人類的社會活動中產生記錄”資訊”之重要性. 在公元前二千年的夏朝,即出現為了管理國家而有統計的管理工作. 人口統計 (census) 源自於拉丁語稅金 (censere) . 在羅馬帝國中 稱之為監察官 (censors) 的官吏為了課稅,也為了能參戰的男子數, 每五年做一次人口和財產的登記......

統計學 (statistics) 這個詞的詞根,在拉丁語中是國家 (status) 的意思. <大不列顛百科全書>(第三版,1979年) 中,定義統計學為”近代導人的一個詞, 用於表示任何王朝,國家,教區的總括或概貌.” Malchus 在他 1826 年所著 <統計學與政治學>一書中把統計學的範圍擴大到”某個給定國家以及與在這個 國家生存的條件和發展有關的,最完全最有根據的知識.”

在許多人們關心與不關心的事件中,包含的不確定成分,會影響到決定.  為了做出正確的決定,將事前得到的資訊加以分析,先將資訊數字化, 再以統計方法來看資訊所攜帶的,清楚的”訊息”,資訊是否正確,資訊是否足夠, 資訊是否以一定的技術方法去搜集,資訊是否是可得......... 如上原因產生了不定性. 對不定的資料,需要隨機性來處理.

隨機現象,在自然科學,生物科學,和社會科學理論發展的必要基礎. 天氣的資料, 藥物的資料,學習狀況的資料,人們搜集大量的資料,為了各種目的,希望有效地 運用資料中的訊息,原始資訊通常是含有雜質並讓人混洧的. 故需做 適當歸納,整理.

統計學提供整理資料的方法,籍由正確的收集資訊,有效率的分析數據, 以得到數據中去蕪存菁的資料. 了解分析的過程和理論,可以更有效的解讀 統計分析後的數據,而不會被數字誤導.

參考資料:統計與真理(九章出版社)
統計,讓數字說話(天下文化)