Stata 是一套提供其使用者數(shu)據分析、數(shu)據管理以及(ji)繪制(zhi)(zhi)專(zhuan)業圖(tu)表(biao)的完整及(ji)整合(he)(he)性統(tong)計軟件。它擁有很多功能,包含線(xian)性混合(he)(he)模(mo)型、均(jun)衡(heng)重復(fu)反(fan)復(fu)及(ji)多項式普羅比模(mo)式。用Stata繪制(zhi)(zhi)的統(tong)計圖(tu)形相當精美。
新版本的(de)(de)STATA采用(yong)最(zui)具親和(he)力的(de)(de)窗口接口,使用(yong)者自行(xing)建立程序時,軟件能提供(gong)具有直接命令式(shi)的(de)(de)語(yu)法(fa)。Stata提供(gong)完整的(de)(de)使用(yong)手冊,包(bao)含統計(ji)樣本建立、解釋、模型與(yu)語(yu)法(fa)、文(wen)獻(xian)等(deng)超過一萬(wan)余頁的(de)(de)出版品。
除此之外,Stata軟件可(ke)以(yi)透過(guo)(guo)網絡實時更新每(mei)天的(de)(de)最新功能(neng),更可(ke)以(yi)得知(zhi)世(shi)界各(ge)地(di)的(de)(de)使(shi)(shi)用者對于STATA公司提(ti)出的(de)(de)問題(ti)與解決(jue)之道(dao)。使(shi)(shi)用者也可(ke)以(yi)透過(guo)(guo)Stata Journal獲得許許多(duo)多(duo)的(de)(de)相關(guan)訊息(xi)以(yi)及書籍介紹等。另外一個(ge)(ge)獲取龐大(da)資(zi)源的(de)(de)管道(dao)就是(shi)Statalist,它是(shi)一個(ge)(ge)獨立的(de)(de)listserver,每(mei)月交替(ti)提(ti)供使(shi)(shi)用者超過(guo)(guo)1000個(ge)(ge)訊息(xi)以(yi)及50個(ge)(ge)程(cheng)序。
Stata官方網(wang)站。Stata公司提(ti)供的(de)Web resources,涵蓋了(le)大(da)量相(xiang)關(guan)網(wang)絡資源;其(qi)FAQ則提(ti)供了(le)各種常見問題的(de)解(jie)答;Statalist則是一(yi)個類似于人(ren)大(da)經濟論壇的(de)免費的(de)討(tao)論區。加(jia)入Statalist的(de)方法很簡單,你(ni)只需要(yao)發送郵件(jian)至Stata-maillist,郵件(jian)內容無(wu)需任何稱謂,只需寫上“subscribe Statalist”的(de)字樣即可(ke)(ke)。接到確(que)認(ren)信息(xi)后,你(ni)便成為(wei)一(yi)名Statalist的(de)成員(yuan)了(le)。當然,即使(shi)不加(jia)入,你(ni)仍(reng)然可(ke)(ke)以(yi)瀏覽,但不能提(ti)問。
UCLA(加州大學洛杉磯(ji)分(fen)校提供的網絡教程。該網站提供的Data Management、Graphics、Regression、Logistic Regression、Multilevel Modeling、Survey Data Analysis等模塊(kuai)(kuai)都非常出色;其(qi)Web Books、Textbook Examples模塊(kuai)(kuai)則(ze)非常細致(zhi)地呈現(xian)了(le)幾十本(ben)非常流行的統計(ji)和計(ji)量教材的Stata實例;對(dui)于LaTeX感興趣的朋友,則(ze)可(ke)以通過Stata Tools for LaTeX模塊(kuai)(kuai)獲得諸多有用(yong)的信息;在Graph examples模塊(kuai)(kuai)中,則(ze)列舉了(le)四十余種圖(tu)形的繪制方(fang)法;最后,在Classes and Seminars模塊(kuai)(kuai)中,你可(ke)以在線觀看數十個Stata教學視頻。
Stata中文討(tao)論專(zhuan)區。目(mu)前,國內(nei)已有(you)多個(ge)專(zhuan)門討(tao)論Stata應用的論壇,包括人大經(jing)(jing)濟論壇Stata專(zhuan)區,公衛人EpiMan等(deng)。這些論壇集中了(le)國內(nei)外數十萬的Stata用戶,為交流和(he)解決Stata應用過(guo)程中遇到的各種問題和(he)經(jing)(jing)驗提(ti)供了(le)很(hen)好的平臺。
自從(cong)Hamilton(1990)出(chu)版Statistics with Stata后(hou)(hou),一系列將計(ji)量(liang)理(li)論(lun)與軟件操(cao)作(zuo)結(jie)合起來的(de)書籍開始相繼面世,而在此之前,人們似乎都(dou)認為(wei)軟件操(cao)作(zuo)是件非常簡單的(de)事情。也正因為(wei)如(ru)(ru)此,很多(duo)學(xue)生在修改完了一個學(xue)年的(de)計(ji)量(liang)經濟學(xue)課程(cheng)后(hou)(hou),仍(reng)然不知道該(gai)如(ru)(ru)何完成OLS估計(ji)。為(wei)此,我列舉的(de)書籍多(duo)附(fu)有Stata實(shi)例(* 表示(shi)我的(de)推薦程(cheng)度),多(duo)數書中的(de)范例數據(ju)都(dou)可通過Stata官方(fang)網站下載。
一份(fen)詳(xiang)細的(de)書單:UCLA提供了的(de)書單 。
入門教材:Baum(2006)*、Newton and Cox(2009)、Chen et al.(2005)、Adkins and Hill(2008)*;Wooldridge(2009)*,波士頓大學的(de)網站上提供了該(gai)書(shu)所有章節(jie)的(de)Stata范(fan)例,是一套(tao)非(fei)常好的(de)學習資料。
綜合(he)性教(jiao)材:Cameron and Trivedi(2005)撰寫的(de)(de)(de)(de)Microeconometrics: Methods and applications一(yi)書全面介紹了微觀計(ji)量(liang)中(zhong)的(de)(de)(de)(de)基本(ben)分析(xi)工具,其(qi)中(zhong)不乏最近十(shi)年(nian)中(zhong)得到廣泛應用的(de)(de)(de)(de)Bootstrap、Monte Carlo模(mo)擬,以(yi)及非參數(shu)估計(ji)法(fa)。二(er)人于2009年(nian)出版(ban)的(de)(de)(de)(de)另一(yi)力(li)作(Cameron and Trivedi(2009)*)是這本(ben)書的(de)(de)(de)(de)姊(zi)妹(mei)篇,重點介紹了常(chang)用計(ji)量(liang)模(mo)型(xing)的(de)(de)(de)(de)Stata實現方法(fa)。
Stata手冊(ce):我一(yi)直非常佩服撰寫Stata手冊(ce)的(de)(de)那些人,他們(men)總能以(yi)最(zui)簡潔的(de)(de)語言說清楚糾結(jie)我很久的(de)(de)問題(ti)。Stata11附有16本電子手冊(ce),僅需統一(yi)放(fang)置于D:stata11utilities目錄下,即可從Stata內部的(de)(de)幫助文件中的(de)(de)Also see部分直接(jie)鏈(lian)接(jie)到相應的(de)(de)PDF說明(ming)書中。作(zuo)為(wei)初學者,我強烈建議你(ni)將[U]和[D]打印出來(lai),反復研讀(du)。stata手冊(ce)內容齊全,但不便于閱讀(du),把命令與(yu)例題(ti)割裂(lie)開來(lai),閱讀(du)起來(lai)很不方(fang)便。
stata軟件在社會科學(xue)研究中的高級應(ying)用(yong):周文光(guang),李(li)堯遠,梁煒(wei) 著,西北工業大學(xue)出(chu)版社出(chu)版。該書詳(xiang)細介(jie)紹(shao)了如何(he)應(ying)用(yong)stata對連續變(bian)量與(yu)(yu)分(fen)(fen)類(lei)變(bian)量進行分(fen)(fen)析(xi),包括回(hui)歸分(fen)(fen)析(xi),時間序列分(fen)(fen)析(xi),面板數據分(fen)(fen)析(xi)等(deng),并(bing)介(jie)紹(shao)了如何(he)使用(yong)stata進行生存分(fen)(fen)析(xi)與(yu)(yu)聚類(lei)分(fen)(fen)析(xi)、編程等(deng)內容。
Stata視頻(pin)。相比于(yu)網絡教程(cheng)和(he)(he)紙本(ben)教材(cai),通過(guo)視頻(pin)學(xue)(xue)(xue)習Stata可能是(shi)最(zui)快(kuai)捷的(de)(de)(de)方式了。UCLA免費發布的(de)(de)(de)視頻(pin)教程(cheng),內(nei)容涉(she)及(ji)Stata入(ru)門(men)、數(shu)據處理(li)和(he)(he)繪圖等(deng)。采用英文(wen)講解,思(si)路清晰。局限在于(yu)所涉(she)及(ji)內(nei)容不夠(gou)系(xi)統,但對(dui)(dui)于(yu)想(xiang)快(kuai)速入(ru)門(men)的(de)(de)(de)學(xue)(xue)(xue)生則是(shi)一(yi)份不錯的(de)(de)(de)參考資料(liao)。同時,藉由這份資料(liao)也可以練習一(yi)下英語聽(ting)力。對(dui)(dui)于(yu)中(zhong)文(wen)用戶而言,人大論壇發布的(de)(de)(de)Stata初級(ji)(ji)和(he)(he)高級(ji)(ji)視頻(pin)則提(ti)供了更(geng)為快(kuai)捷的(de)(de)(de)學(xue)(xue)(xue)習方式。其中(zhong),初級(ji)(ji)視頻(pin)主要(yao)介(jie)紹(shao)(shao)stata的(de)(de)(de)操作方法(fa),包括stata入(ru)門(men)、stata數(shu)據處理(li)、stata繪圖、stata矩(ju)陣以及(ji)stata編程(cheng)初步五個部(bu)分。高級(ji)(ji)視頻(pin)主要(yao)介(jie)紹(shao)(shao)各種計量模(mo)(mo)型的(de)(de)(de)基本(ben)原理(li),重點介(jie)紹(shao)(shao)其在stata中(zhong)的(de)(de)(de)實現方法(fa),包括OLS、GLS、MLE、IV-GMM、時間(jian)序(xu)列(lie)分析(xi)、面板(ban)模(mo)(mo)型、stata高級(ji)(ji)編程(cheng)、Bootstrap和(he)(he)Monte Carlo模(mo)(mo)擬等(deng)內(nei)容,比較全(quan)面的(de)(de)(de)涵蓋了計量經濟學(xue)(xue)(xue)和(he)(he)核心內(nei)容。
統計方法:Rabe-Hesketh and Everitt(2006)。
Stata繪圖:Mitchell(2008),非常(chang)細致地介(jie)紹了(le)各種圖形的繪制(zhi)方法(fa)。
Stata數(shu)據處理:Kohler and Kreuter(2005)*、Long(2009)*、楊菊華(2008)。
Stata編程:Baum(2009),當然,該(gai)書中有關數據處理的介紹(shao)也非常精彩。
Logit/Probit模(mo)型(xing):Hosmer and Lemeshow(2000)*對相關(guan)的(de)(de)理(li)論進行(xing)非常細致的(de)(de)介紹,是(shi)我(wo)學習Logit模(mo)型(xing)的(de)(de)入門教材;Long and Freese(2001)*、Long and Freese(2006)、Hilbe(2009)則涉及了(le)大(da)量的(de)(de)Stata實例,對解讀Logit/Probit模(mo)型(xing)的(de)(de)結果很有幫助;Rabe-Hesketh et al.(2004)提供了(le)在GLLAMM架構(gou)下估計xtlogit, xtprobit, xtmelogit以及xtmepoisson模(mo)型(xing)的(de)(de)方法。
Panel Data和多層次模型:Stata11 手冊(ce)[XT]*,簡(jian)潔(jie)明了,附(fu)有大(da)量實例;Cameron and Trivedi(2009)*、王志剛(gang)(2008)、Rabe-Hesketh and Skrondal(2008)。
Mata:Schmidheiny(2008)*,簡潔明了(le)介紹了(le)Mata的基本用(yong)法(fa);詳情則可參與Stata11手冊[M]。
GLLAMM:Rabe-Hesketh et al.(2004)。
Meta:Sterne(2009)。
GLM:Hardin et al.(2007)。
MLE:Harrison(2008)(Lectures)、Gould et al.(2006)。
生存分析:Cleves et al.(2008)。
Stata是(shi)一個統(tong)(tong)計分(fen)析軟件,但它也具(ju)有很(hen)強的(de)程序語言(yan)功能,這給用戶提(ti)供了一個廣闊的(de)開發應用的(de)天地,用戶可以充分(fen)發揮自己的(de)聰明才智,熟練應用各種技巧,真(zhen)正(zheng)做到隨心所欲(yu)。事(shi)實上(shang),Stata的(de)ado文件(高級(ji)統(tong)(tong)計部分(fen))都(dou)是(shi)用Stata自己的(de)語言(yan)編寫(xie)的(de)。
Stata其統計分(fen)(fen)析(xi)能(neng)力遠(yuan)遠(yuan)超過(guo)(guo)了(le)SPSS,在許多方(fang)面(mian)也超過(guo)(guo)了(le)SAS!由(you)于Stata在分(fen)(fen)析(xi)時是將數(shu)據全(quan)部(bu)讀入內(nei)存,在計算全(quan)部(bu)完成后(hou)才和(he)磁盤交換數(shu)據,因此計算速(su)度極(ji)快(kuai)(一般來(lai)說, SAS的(de)運算速(su)度要比(bi)SPSS至(zhi)少快(kuai)一個數(shu)量級(ji),而(er)Stata的(de)某些模塊(kuai)和(he)執(zhi)行(xing)同(tong)樣功能(neng)的(de)SAS模塊(kuai)比(bi),其速(su)度又(you)比(bi)SAS快(kuai)將近一個數(shu)量級(ji)!)Stata也是采用(yong)(yong)命令(ling)行(xing)方(fang)式來(lai)操作,但使用(yong)(yong)上遠(yuan)比(bi)SAS簡單。其生存數(shu)據分(fen)(fen)析(xi)、縱向數(shu)據(重(zhong)復(fu)測(ce)量數(shu)據)分(fen)(fen)析(xi)等模塊(kuai)的(de)功能(neng)甚至(zhi)超過(guo)(guo)了(le)SAS。用(yong)(yong)Stata繪(hui)制的(de)統計圖形相當精美,很有特(te)色。
Stata的(de)(de)統(tong)計(ji)功能(neng)很強,除了傳統(tong)的(de)(de)統(tong)計(ji)分(fen)析(xi)方(fang)法外,還收集了近20年發展起來的(de)(de)新(xin)方(fang)法,如Cox比例風險回(hui)歸(gui)(gui),指數與Weibull回(hui)歸(gui)(gui),多類結果(guo)與有序(xu)結果(guo)的(de)(de)logistic回(hui)歸(gui)(gui),Poisson回(hui)歸(gui)(gui),負二(er)項(xiang)回(hui)歸(gui)(gui)及廣義負二(er)項(xiang)回(hui)歸(gui)(gui),隨(sui)機效(xiao)應模型等。具體說, Stata具有如下(xia)統(tong)計(ji)分(fen)析(xi)能(neng)力:
數(shu)值變量資料的(de)一般分析:參數(shu)估(gu)計,t檢驗,單因素和(he)多(duo)因素的(de)方(fang)差分析,協(xie)方(fang)差分析,交互效應(ying)模型,平(ping)衡和(he)非平(ping)衡設(she)計,嵌(qian)套設(she)計,隨機效應(ying),多(duo)個(ge)均(jun)數(shu)的(de)兩(liang)兩(liang)比較(jiao),缺項數(shu)據的(de)處理,方(fang)差齊性(xing)檢驗,正(zheng)態(tai)性(xing)檢驗,變量變換(huan)等。
分類資料的(de)一(yi)般分析:參(can)數估計(ji),列聯(lian)表分析 ( 列聯(lian)系(xi)數,確切概率(lv) ) ,流行病學表格分析等。
等級資(zi)料的一般分析:秩(zhi)(zhi)變換,秩(zhi)(zhi)和檢驗(yan),秩(zhi)(zhi)相關等
相關(guan)與(yu)回歸(gui)(gui)分(fen)析(xi):簡單(dan)相關(guan),偏相關(guan),典(dian)型相關(guan),以及多(duo)達數(shu)十(shi)種的(de)回歸(gui)(gui)分(fen)析(xi)方法(fa),如多(duo)元線(xian)性回歸(gui)(gui),逐步回歸(gui)(gui),加(jia)權回歸(gui)(gui),穩(wen)鍵回歸(gui)(gui),二階段回歸(gui)(gui),百分(fen)位數(shu) ( 中位數(shu) ) 回歸(gui)(gui),殘差分(fen)析(xi)、強影響點分(fen)析(xi),曲線(xian)擬(ni)合,隨機效應的(de)線(xian)性回歸(gui)(gui)模型等。
其他(ta)方法:質量控制(zhi),整群抽樣的設計效率(lv),診斷(duan)試(shi)驗評(ping)價, kappa等。
Stata的(de)(de)作(zuo)圖(tu)(tu)模(mo)塊(kuai),主要提(ti)供(gong)(gong)如下八種基本圖(tu)(tu)形的(de)(de)制作(zuo) : 直方圖(tu)(tu)(histogram),條形圖(tu)(tu)(bar),百分(fen)條圖(tu)(tu) (oneway),百分(fen)圓圖(tu)(tu)(pie),散點(dian)圖(tu)(tu)(two way),散點(dian)圖(tu)(tu)矩陣(zhen)(matrix),星形圖(tu)(tu)(star),分(fen)位數(shu)圖(tu)(tu)。這些圖(tu)(tu)形的(de)(de)巧妙應用,可以滿(man)足(zu)絕(jue)大(da)多數(shu)用戶的(de)(de)統(tong)計作(zuo)圖(tu)(tu)要求。在有(you)些非繪圖(tu)(tu)命令(ling)中(zhong),也提(ti)供(gong)(gong)了(le)(le)專門繪制某種圖(tu)(tu)形的(de)(de)功能,如在生存(cun)分(fen)析中(zhong),提(ti)供(gong)(gong)了(le)(le)繪制生存(cun)曲線圖(tu)(tu),回(hui)歸分(fen)析中(zhong)提(ti)供(gong)(gong)了(le)(le)殘差圖(tu)(tu)等。
矩(ju)(ju)(ju)陣代數是多元統計(ji)分(fen)(fen)(fen)析的(de)重(zhong)要工具, Stata提(ti)供(gong)了多元統計(ji)分(fen)(fen)(fen)析中所(suo)需的(de)矩(ju)(ju)(ju)陣基本運算,如矩(ju)(ju)(ju)陣的(de)加、積、逆(ni)、 Cholesky分(fen)(fen)(fen)解、 Kronecker內積等;還(huan)(huan)提(ti)供(gong)了一(yi)些高(gao)級運算,如特征根、特征向(xiang)量、奇異值分(fen)(fen)(fen)解等;在執行完某些統計(ji)分(fen)(fen)(fen)析命(ming)令后,還(huan)(huan)提(ti)供(gong)了一(yi)些系統矩(ju)(ju)(ju)陣,如估(gu)(gu)計(ji)系數向(xiang)量、估(gu)(gu)計(ji)系數的(de)協方差(cha)矩(ju)(ju)(ju)陣等。
數據管理(Data management)
資料轉換、分組處理、附加檔案(an)、 ODBC 、行 - 列轉換、數據標記、字符串(chuan)函數…等
基本統計(Basic statistics)
直交表(biao)、相關性、 t- 檢定(ding)、變(bian)異(yi)數相等(deng)性檢定(ding)、比例(li)檢定(ding)、信賴區間…等(deng)
線性模(mo)式(Linear models)
穩(wen)健Huber/White/sandwich變(bian)異(yi)估計 , 三階(jie)最小(xiao)平方法、類非相關回歸、齊次多項式回歸、GLS
廣義型(xing)線性(xing)模式(Generalized linear models)
十連(lian)(lian)結(jie)函數、使用者-定義連(lian)(lian)結(jie)、 ML及IRLS估(gu)計(ji)、九(jiu)變(bian)異數估(gu)計(ji)、七殘差…等
二元(yuan)、計數及有限(xian)應變量(Binary, count and limited dependent variables)
羅吉(ji)斯特(te)、probit、卜(bu)松回歸、tobit、truncated回歸、條件羅吉(ji)斯特(te)、多項式(shi)邏輯、巢狀邏輯、負二項、 zero-inflated模(mo)型、Heckman 選擇模(mo)式(shi)、邊際(ji)影響
Panel數據/交(jiao)叉 - 組合時間序列(Panel data/cross-sectional time-series)
隨(sui)(sui)機及(ji)固(gu)定(ding)(ding)影(ying)響(xiang)之回歸(gui)、GEE、隨(sui)(sui)機及(ji)固(gu)定(ding)(ding)-影(ying)響(xiang)之卜松及(ji)負二項分配、隨(sui)(sui)機 - 影(ying)響(xiang)、工具(ju)變量回歸(gui)、AR(1) 干擾回歸(gui)
無母數方法(Nonparametric methods)
多變量方法(fa)(Multivariate methods)
因素分析、多變量回(hui)歸、 anonical 相關系(xi)數
模型檢(jian)定及事后估計量(liang)支持分析(Model testing and post-estimation support)
Wald檢(jian)定、LR檢(jian)定、線(xian)性(xing)(xing)及非線(xian)性(xing)(xing)組合(he)、非線(xian)性(xing)(xing)限制檢(jian)定、邊際影響、修正(zheng)平均數Hausman檢(jian)定
群集分析(Cluster analysis)
加權平均、質量中(zhong)心(xin)及中(zhong)位數聯結、kmeans、kmedians、dendrograms、停止規則(ze)、使(shi)用者擴充(chong)
圖形(Graphics)
直線圖、散布圖、條狀圖、圓餅圖、 hi-lo 圖、回歸診斷(duan)圖…
調查方法(Survey methods)
抽(chou)樣權重、叢集抽(chou)樣、分層、線性變異數(shu)估(gu)計量、擬 - 概似最大估(gu)計量、回(hui)歸、工具變量…
生存分析(Survival analysis)
Kaplan–Meier、Nelson–Aalen、Cox回歸(弱(ruo)性)、參數模(mo)式(弱(ruo)性)、危險比例測試、時間共變項、左-右檢(jian)查、韋柏分配(pei)、指數分配(pei)…
流行病學工具(ju)(Tools for epidemiologists)
比(bi)例(li)標準化、病例(li)控制、已配適(shi)病例(li)控制、Mantel – Haenszel,藥理學(xue)、ROC分(fen)析(xi)、ICD-9-CM
時間序列(Time series)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白(bai)色 - 噪音測(ce)試、最(zui)小整數(shu)根檢(jian)定(ding)、時間序列運算、平(ping)滑化
最(zui)大概似(si)法(Maximum likelihood)
轉(zhuan)換及常態檢定(ding)(Transforms and normality tests)
Box–Cox、次方轉換Shapiro–Wilk、Shapiro–Francia檢定
其它(ta)統(tong)計(ji)方法(Other statistical methods)
樣本數(shu)量及次方、非線性回歸(gui)、逐(zhu)步式回歸(gui) 、統計及數(shu)學函(han)數(shu)
包(bao)含樣(yang)本范例(Sample session)
再抽(chou)樣及模擬方法(Resampling and simulation methods)
bootstrapping、jackknife、蒙(meng)地卡(ka)羅模擬(ni)、排列檢定
網絡功能
安(an)裝新指令、網(wang)絡升(sheng)級、網(wang)站檔案分(fen)享、Stata 最新消息
epiman論壇學習資源豐(feng)富,學術氛(fen)圍良好(hao),在國內新生代公共衛生學術界有一(yi)(yi)定影響力。是探討Stata、spss、sas、epidata等統計軟件的主流論壇之(zhi)一(yi)(yi)。