2015年9月25日 星期五

R 分析初探:descriptive statistics

       果然學習必須從實作中著手,嘗試先從clinical proteomic tumor analysis consortium的癌資料,這癌症組織的蛋白體資料庫是伴隨於2005年美國癌症基因體計畫(Cancer Genetic Atlas)而產生的,目前已完成20種癌症組織的基因定序,而蛋白質體的資料目前只有卵巢、乳癌和直腸大腸癌,每組資料庫都是完全開源,大小都超過1TB以上,所以是使用實驗室的叢集電腦作為儲存以及運算的核心。

         一開始,先從分析這三個癌症的臨床資料著手,將其csv檔匯入R中,在進行簡單的process和處置,在製作圖表。從圖表的變化可以看出進步xd












0 意見 :

張貼留言