返回
顶部

Stata安装手册 软件试用 数据统计分析软件包

软件简介


       Stata 是一套集数据分析、数据管理以及绘制专业图表于一体的整合性统计软件,也是当前三大权威同机软件之一,功能非常强大,具有操作灵活、简单、易学易用、运行速度极快等优点。他有多个版本。Stata/MP,这是运行最快和处理数据集最大的Stata版本,允许数据集最多可达120,000个变量。几乎每台电脑都可充分发挥Stata/MP先进的多元处理功能。Stata/MP可在多核心或多处理器电脑上执行,并且对于统计与数据管理功能,提供最广泛的多核心支持。Stata/MP相比Stata/SE,安装在双核心笔记型电脑上,将为您节省二分之一到三分之二的时间来分析数据;安装在四核心台式机与笔记型电脑上,将为您节省四分之一到二分之一的时间;安装在多重处理器服务器上执行将更加快速。Stata/MP支持多达64个核心/处理器。

Stata相关活动集锦


近期Stata软件相关新闻


“Stata冬季训练营暨空间计量经济与结构方程模型研讨会”在京圆满结束

2018年“Stata夏季训练营“在顺德职业技术学院顺利闭营!

近期Stata软件相关培训安排如下


Stata春季训练营—空间计量经济与结构方程模型研讨会-火热报名中

Stata软件近期免费网络研讨会,新增中文研讨会,送给热爱学习的你

Stata冬季训练营 (北京站)

Stata夏季训练营-王群勇专场 “Stata应用与案例分析课程”

Stata夏季训练营-连玉君专场 “Stata计量与实证分析课程”

第二届Stata中国用户大会暨“计量经济方法及应用研讨会”

Stata校园行活动火热招募中


最专业的定制培训应运而生,暖心打造属于你的精彩!






  • Stata 15
  • Why Stata?
  • 功能版本及系统要求
  • 软件详细功能
  • Stata中国用户会议
  • Stata校园行活动
  • 原厂相关资源

Stata 15 in Chinese 中文版介绍


       2017年12月,赶在圣诞节来临之际,Stata正式推出中文版本。Stata的所有界面、所有菜单和所有对话框现在都可以用中文了!点击查阅详情

Stata 15新功能


ERM=内生性+选择+处理

在连续、二元、有序和删剪结果中结合内源性变量、样本选择和模型的内源性处理
……

Ermistatas Eureka

潜在类别分析(LCA)

发现并理解数据中未被观测到的组。使用LCA基于模型的分类功能找出分组
一共有多少个分组
这些分组中都有谁
这些分组有什么区别
……

贝叶斯:logistic和其他44种新功能

输入 bayes:45个Stata评估命令都可以用来拟合贝叶斯回归模型
……

Markdown & dynamic documents

to

用Stata创建网页
混合文本、回归、结果、图表等
查看数据或命令自动反映在网页上的变化
……

Linearized DSGEs

用简单的代数形式编写模型。剩下的交给Stata:求解模型、估计参数、估计政策和过渡矩阵(配合CIs),估计和图表IRFs,并执行预测
……

Finite mixture models (FMMs)

17种估计和组合 连续的,二进制的,计数的,顺序的,分类的,删减的,和截断的结果 生存结果
……

空间自回归模型

Because
sometimes
where you are matters.
……

区间删失生存模型

适合任何Stata六参数生存模型的区间删失数据。支持所有常用的生存特征:分层估计,稳健和群集SEs,调查数据,图表以及其他。
……

非线性多级混合效应模型

When ... your science ... says ...
your model ... is ...
nonlinear in its parameters
……

混合logit模型:高级选择模型

我们每天都会做无数个选择。研究人员可以获取无数这些选择的数据。混合logit将随机效应引入选择建模,从而放宽IIA假设并增加模型灵活性。
……

非参数回归

When you know something matters.
But have no idea how.
……

在Stata中创建Word文档

自动生成报告
将段落和表格写入Word文档
在段落和表格中嵌入Stata结果和图形
定制文本、表和单元格的格式
……

贝叶斯多级模型

少量群组?
许多层级?
更愿意做概率陈述?
考虑贝叶斯多级建模。
……

门限回归

时间序列回归可能会在某个时间点或多个时间点改变参数。在某些阈值以上的温度下,觅食动物的活动可能遵循完全不同的模式。你可能不知道那个阈值的数值,找到这样的阈值并在这些机制中估计参数就是阈值回归所做的。
……

面板tobit随机系数

在面板数据中,Stata很早就有了随机效应(随机拦截)的估计。
现在你也可以有随机系数。
……

搜索、浏览和导入FRED数据

圣路易斯联邦储备银行提供了超过47万的美国和国际经济金融时间序列。现在可以轻松地搜索、浏览和导入这些数据。
……

区间测量结果的多元回归

收入有时被记录在分组中,如人们的体重、昆虫数量、等级平均数以及其他数百项指标。我们经常对个人,学校,果园进行重复测量..... 我们需要区间回归(区间删失)结果的多级回归。
……

删失结果的多级Tobit回归

左删失,右删失,两者都有
通过观测而审查变化
对未经审查的或者被审查的结果进行推断
稳健和群集SEs
支持调查数据
……

面板数据协整检验

Kao、 Pedroni、 Westerlund
一共9种不同的检验
……

时间序列多重断点检验

累积和(CUSUM) 参数稳定性检验、 累积和递归残差
累积和OLS残差、 CIs图
……

多组广义SEM

广义SEM现在支持多组分析。可以轻松地在组中指定组和检验参数不变性。GSEM模型包括: 连续的,二进制的,序数的,计数的,分类的,甚至是生存结果
多层模型
……

ICD-10-CM/PCS

CMS的ICD-10-PCS诊断代码 、 CMS的ICD-10-PCS程序代码
验证码是有效的、 基于代码创建新的变量
……

集群随机化设计的功率

累比较功率分析
一个或两个样本均值、 一个或两个样本比例、 两个样本的生存曲线
随机化一个集群而不是个体
……

线性回归模型的功率

用于求解: 功率 、 样本大小、 效应量
指定列表: α值 、 功率级、 β值、 样本大小、 更多...
自动化表格和图表
……

Heteroskedastic线性回归

模型方差
稳健和群集SEs
支持调查数据
……

样本选择的Poisson模型

统计数量是常见的。
你抓住了多少条鱼?
发生了多少起事故?
一个公司有多少项专利?
结果并不总是一定的
所以你就需要Poisson模型来进行样本筛选
……

面板数据的更多功能

随机效应的非线性模型,包括随机系数
贝叶斯面板数据模型
随机截局和随机系数的区间回归
……

图形的更多功能

图形中的透明度
SVG输出
……

更多的统计功能

贝叶斯生存模型
零膨胀有序概率元
添加功率和样本大小的方法
贝叶斯样本选择模型
……

界面的更新

Stata的瑞典语版本


Stata的中文版本

其他

随机数流生成器
改进了Java插件
……

完整的英文新功能介绍请参看:https://www.stata.com/new-in-stata/



玩转Stata 15 新版本:(点击以下标题跳转爬虫俱乐部推文)


《玩转Stata15之fred数据的读取》
《玩转stata15—putdocx生成word文档》
《玩转Stata15—Stata15的几个细节》
《玩转stata15—putdocx导入图表》
《玩转Stata15—putdocx append将它们粘起来!》
《putdocx+wordconvert—将实证结果输出到Word(.docx)文档》
《玩转stata15——图片透明了!》
《Stata 15之Markdown——没有做不到,只有想不到!》
《使用putdocx输出list的结果》
《Putdocx输出list结果(二)》
《命令sum2docx输出统计量表到docx文件》
《用reg2docx报告你的实证结果吧!》
《在stata中如何实现tex文档到pdf的转换》

       更多推文持续更新中~



Stata是一个完整的集成软件包,可提供您的所有数据科学需求 - 数据处理,可视化,统计和可重现的报告。


  • Master your data

    Stata的数据管理功能如下:
    进出口
    ODBC,SQL
    排序,匹配,合并,加入,追加,创建
    内置电子表格
    unicode
    处理文本或二进制数据
    在本地或在Web上访问数据
    收集组间的统计信息
    BLOBs -strings可以容纳整个文档
    数十亿行
    成千上万的变数
    生存数据, 面板数据, 多级数据, 调查数据, 多重插补数据, 分类数据, 时间序列数据
    更重要的是,支持您的所有数据科学需求。

  • 广泛的统计功能

  • 出版品质的图形


    Stata可以轻松生成出版品质,风格独特的图形。

    可以指向并单击以创建自定义图形。或者,编写脚本以可重现的方式生成数百或数千个图形。将图形导出为EPS或TIFF以供发布,将PNG或SVG导出为Web,或导出为PDF以供查看。使用集成的图形编辑器,可以单击以更改有关图形的任何内容,或添加标题,注释,线条,箭头和文本。

  • 动态文档创建

    自动报告结果所需的所有工具 。

    动态Markdown文档
    创建Word文档
    创建PDF文档
    创建Excel文件
    图形方案
    Word,HTML,PDF,SVG,PNG








  • 真正可重复的研究

    很多人谈论可重复的研究。
    Stata已经致力于它超过30年。
    我们不断添加新功能; 我们甚至从根本上改变了语言元素。不管。Stata是唯一具有集成版本控制的统计软件包。如果你在1985年编写了一个脚本来执行分析,那么同样的脚本仍然可以运行,并且今天仍会产生相同的结果。您在1985年创建的任何数据集,今天都可以阅读。在2050年也是如此.Stata将能够运行你今天所做的任何事情。
    我们认真对待再现性。

  • 可信

    我们不只是编程统计方法,我们验证它们。
    您从Stata估算器中看到的结果依赖于与其他估算器的比较,蒙特卡罗模拟的一致性和覆盖范围,以及我们的统计人员进行的大量测试。我们发运的每个Stata都通过了一个认证套件 ,其中包括230万行测试代码,可生成430万行输出。我们对430万行输出中的每个数字和文本进行认证。

  • 真实的文档

    我们的每个数据管理功能都经过充分解释和记录,并在实际示例中显示。每个估算器都有完整的文档记录,包括几个关于实际数据的示例,以及如何解释结果的真实讨论。这些示例为您提供数据,以便您可以在Stata中工作甚至扩展分析。我们为您提供每个功能的快速入门,展示一些最常见的用途。想要更多细节?我们的方法和公式部分提供了计算内容的具体信息,我们的参考文献为您提供了更多信息。 Stata是一个很大的包,所以有很多文档 - 超过14,000页,共27卷。但不要担心,键入帮助 我的主题,Stata将搜索其关键字,索引,甚至社区提供的包,为您带来您需要了解的主题。一切都在Stata内可用。

  • 简单易用

    Stata的所有功能都可以通过 菜单,对话框,控制面板,数据编辑器,变量管理器,图形编辑器甚至SEM 图形生成器来访问。您可以通过任何分析指向并单击您的方式。
    如果您不想编写命令和脚本,则不必这样做。
    即使您指向并单击,也可以记录所有结果,然后将其包含在报告中。您甚至可以保存您的操作创建的命令,并在以后重现您的完整分析。

  • 容易掌握

    Stata执行任务的命令直观且易于学习。更好的是,您学习执行任务的所有内容都可以应用于其他任务。例如,您只需将性别==“女性”添加到任何命令,以限制您对样本中的女性进行分析。您只需将vce(robust)添加到任何估算器中,以获得对许多常见假设都很稳健的标准误差和假设检验。
    一致性甚至更深。您对数据管理命令的了解通常适用于估算命令,反之亦然。还有一整套postestimation命令来执行假设检验,形成线性和非线性组合,进行预测,形成对比,甚至用交互图进行边际分析。在几乎每个估算器之后,这些命令的工作方式相同。
    排序命令来读取和清理数据,然后执行统计测试和估计,最后报告结果是可重复研究的核心。Stata使所有研究人员都可以访问此过程。

  • 易于自动化

    每个人都有他们一直在做的任务 - 创建特定类型的变量,生成特定的表,执行一系列统计步骤,计算RMSE等。可能性是无穷无尽的。Stata有数千个内置程序,但可能拥有相对独特的任务或者您希望以特定方式完成的任务。
    如果您编写了一个脚本来执行给定数据集上的任务,则可以轻松地将该脚本转换为可用于所有数据集,任何变量集以及任何观察集的内容。

  • 易于扩展

    自动化的一些内容可能非常实用。只需一点代码,就可以将自动化脚本转换为Stata命令。支持Stata官方命令支持的标准功能的命令。可以与使用官方命令相同的方式使用的命令。

  • 高级编程

    Stata还包括一种高级编程语言-Mata。
    Mata具有您期望在编程语言中使用的结构,指针和类,并为矩阵编程添加了直接支持。
    Mata既是一个用于操作矩阵的交互式环境,也是一个可以生成编译和优化代码的完整开发环境。它包括处理面板数据的特殊功能,对实际或复杂矩阵执行操作,为面向对象编程提供全面支持,并与Stata的各个方面完全集成。

Stata各系列版本区别


 Stata/MP, Stata/SE, Stata/IC主要的区别在于每个版本能够分析的数据集大小不同。
 Stata/MP : 是一个拥有并行处理能力,适合双核、多核、多处理器计算机的Stata版本,允许数据集最多可达12万个变量。
 Stata/SE : 适合大数据集的Stata版本,允许数据集最多可达32,767个变量。
 Stata/IC : Stata标准版本,允许多达2,048个变量的数据集。

Product features Stata/IC Stata/SE Stata/MP
Maximum number of variables
2,048 32,767 120,000
Maximum number of observations
2.14 billion 2.14 billion Up to 20 billion
Maximum number of independent variables
798 10,998 10,998
Multicore support

Time to run logistic regression with 5 million obs and 10 covariates

1-core
10.0 sec
1-core
10.0 sec
2-core 4-core 4+
5.0 sec 2.6 sec Even faster
Complete suite of statistical features
Yes! Yes!
Yes! Yes! Yes!
Publication-quality graphics
Yes! Yes!
Yes! Yes! Yes!
Matrix programming language
Yes! Yes!
Yes! Yes! Yes!
Complete PDF documentation
Yes! Yes!
Yes! Yes! Yes!
Exceptional technical support
Yes! Yes!
Yes! Yes! Yes!
Includes within-release updates
Yes! Yes!
Yes! Yes! Yes!
64-bit version available
Yes! Yes!
Yes! Yes! Yes!
Windows, macOS, and Linux
Yes! Yes!
Yes! Yes! Yes!

软件安装


系统要求

Stata for Windows
Windows 10 *
Windows 8 *
Windows 7 *
Windows Vista *
Windows Server 2016, 2012, 2008, 2003 *
* 64-bit Windows varieties for x86-64 made by Intel® and AMD

Stata for Mac
Stata for macOS requires 64-bit Intel® processors (Core™2 Duo or better) running macOS 10.9 or newer

Stata for Linux
Any 64-bit (x86-64 or compatible) running Linux
For xstata, you need to have GTK 2.24 installed

Hardware requirements

Package Memory Disk space
Stata/MP 4GB 1GB
Stata/SE 2GB 1GB
Stata/IC 1GB 1GB

软件功能


一、统计功能

       Stata 的统计功能十分强大,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如 Cox 比例风险回归,指数与 Weibull 回归,多类结果与有序结果的 logistic 回归, Poisson 回归,负二项回归及广义负二项回归,随机效应模型等。Stata 具有如下详细的统计分析能力:

统计分析能力 能力介绍
数值变量资料的一般分析 参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。
分类资料的一般分析 参数估计,列联表分析 ( 列联系数,确切概率 ) ,流行病学表格分析等。
等级资料的一般分析 秩变换,秩和检验,秩相关等。
相关与回归分析 简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。
其他方法 质量控制,整群抽样的设计效率,诊断试验评价, kappa 等。


二、作图功能

       Stata 的作图模块,15版本增加了多个新图形制作:

条形图 (Bar charts) 箱线图 (Box plots) 直方图 (Histograms) 穗地块 (Spike plots)
饼图 (Pie charts) 散点图矩阵(Scatterplot matrices) 点图 (Dot charts) 线型图 (Line charts)
面积图 (Area charts) 双向图 (Two-way scatterplots) 填充和轮廓等高线图 (Filled and outlined contour plots)

       这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。

三、矩阵运算功能

       矩阵代数是多元统计分析的重要工具, Stata 提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky 分解、 Kronecker 内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。

四、程序设计功能

       Stata 是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。Stata 的 ado 文件 ( 高级统计部分 ) 是用 Stata 自己的语言编写的。
       Stata 其统计分析能力远远超过了 SPSS ,在许多方面也超过了 SAS 。由于 Stata 在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快(一般来说, SAS 的运算速度要比 SPSS 至少快一个数量级,而 Stata 的某些模块和执行同样功能的 SAS 模块比,其速度又比 SAS 快将近一个数量级。) Stata 也是采用命令行方式来操作,但使用上远比 SAS 简单。其生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了 SAS 。用 Stata 绘制的统计图形相当精美,很有特色。

五、功能列表

功能名称 功能介绍
线性模型
(Linear models)
regression   •   censored outcomes   •   endogenous regressors   •   bootstrap, jackknife, and robust and cluster–robust variance   •   instrumental variables   •   three-stage least squares   •   constraints   •   quantile regression   •   GLS   •    more
面板/纵向数据
(Panel/longitudinal data)
random and fixed effects with robust standard errors   •   linear mixed models   •   random-effects probit   •   GEE   •   random- and fixed-effects Poisson   •   dynamic panel-data models   •   instrumental variables   •   panel unit-root tests   •    more
多级混合效应模型
(Multilevel mixed-effects models)
continuous, binary, count, and survival outcomes   •   two-, three-, and higher-level models   •   generalized linear models   •   nonlinear models   •   random intercepts   •   random slopes   •   crossed random effects   •   BLUPs of effects and fitted values   •   hierarchical models   •   residual error structures   •   DDF adjustments   •   support for survey data   •    more
二进制、计数和有限结果
(Binary, count, and limited outcomes)
logistic, probit, tobit   •   Poisson and negative binomial   •   conditional, multinomial, nested, ordered, rank-ordered, and stereotype logistic   •   multinomial probit   •   zero-inflated and left-truncated count models   •   selection models   •   marginal effects   •    more
扩展回归模型(ERMs)
(Extended regression models (ERMs))
combine endogenous covariates, sample selection, and nonrandom treatment in models for continuous, interval-censored, binary, and ordinal outcomes   •    more
广义线性模型(GLMs)
(Generalized linear models (GLMs))
ten link functions   •   user-defined links   •   seven distributions   •   ML and IRLS estimation   •   nine variance estimators   •   seven residuals   •    more
有限混合模型(FMMs)
(Finite mixture models (FMMs))
fmm: prefix for 17 estimators   •   mixtures of a single estimator   •   mixtures combining multiple estimators or distributions   •   continuous, binary, count, ordinal, categorical, censored, truncated, and survival outcomes   •    more
空间自回归模型
(Spatial autoregressive models)
spatial lags of dependent variable, independent variables, and autoregressive errors   •   fixed and random effects in panel data   •   endogenous covariates   •   analyze spillover effects   •    more
方差分析/多变量方差分析
(ANOVA/MANOVA)
balanced and unbalanced designs   •   factorial, nested, and mixed designs   •   repeated measures   •   marginal means   •   contrasts   •    more
精确统计
(Exact statistics)
exact logistic and Poisson regression   •   exact case–control statistics   •   binomial tests   •   Fisher’s exact test for r × c tables   •    more
线性动态随机一般均衡模型
(Linearized DSGE models)
specify models algebraically   •   solve models   •   estimate parameters   •   identification diagnostics   •   policy and transition matrices   •   IRFs   •   dynamic forecasts   •    more
测试、预测和结果
(Tests, predictions, and effects)
Wald tests   •   LR tests   •   linear and nonlinear combinations   •   predictions and generalized predictions   •   marginal means   •   least-squares means   •   adjusted means   •   marginal and partial effects   •   forecast models   •   Hausman tests   •    more
差异、成对比较和差数
(Contrasts, pairwise comparisons, and margins)
compare means, intercepts, or slopes   •   compare with reference category, adjacent category, grand mean, etc.   •   orthogonal polynomials   •   multiple-comparison adjustments   •   graph estimated means and contrasts   •   interaction plots   •    more
简单最大概似法
(Simple maximum likelihood)
specify likelihood using simple expressions   •   no programming required   •   survey data   •   standard, robust, bootstrap, and jackknife SEs   •   matrix estimators   •    more
可编程最大概似法
(Programmable maximum likelihood)
user-specified functions   •   NR, DFP, BFGS, BHHH   •   OIM, OPG, robust, bootstrap, and jackknife SEs   •   Wald tests   •   survey data   •   numeric or analytic derivatives   •    more
再抽样及模拟方法
(Resampling and simulation methods)
bootstrap   •   jackknife   •   Monte Carlo simulation   •   permutation tests   •    more
时间序列
(Time series)
ARIMA   •   ARFIMA   •   ARCH/GARCH   •   VAR   •   VECM   •   multivariate GARCH   •   unobserved-components model   •   dynamic factors   •   state-space models   •   Markov-switching models   •   business calendars   •   tests for structural breaks   •   threshold regression   •   forecasts   •   impulse–response functions   •   unit-root tests   •   filters and smoothers   •   rolling and recursive estimation   •    more
生存分析
(Survival analysis)
Kaplan–Meier and Nelson–Aalen estimators,   •   Cox regression (frailty)   •   parametric models (frailty, random effects)   •   competing risks   •   hazards   •   time-varying covariates   •   left-, right-, and interval-censoring   •   Weibull, exponential, and Gompertz models   •    more
贝叶斯分析
(Bayesian analysis)
thousands of built-in models   •   univariate and multivariate models   •   linear and nonlinear models   •   multilevel models   •   continuous, binary, ordinal, and count outcomes   •   bayes: prefix for 45 estimation commands   •   continuous univariate, multivariate, and discrete priors   •   add your own models   •   convergence diagnostics   •   posterior summaries   •   hypothesis testing   •   model comparison   •    more
功效和样本大小
(Power and sample size)
power   •   sample size   •   effect size   •   minimum detectable effect   •   means   •   proportions   •   variances   •   correlations   •   ANOVA   •   regression   •   cluster randomized designs   •   case–control studies   •   cohort studies   •   contingency tables   •   survival analysis   •   balanced or unbalanced designs   •   results in tables or graphs   •    more
治疗效果/因果推断
(Treatment effects/Causal inference)
inverse probability weight (IPW)   •   doubly robust methods   •   propensity-score matching   •   regression adjustment   •   covariate matching   •   multilevel treatments   •   endogenous treatments   •   average treatment effects (ATEs)   •   ATEs on the treated (ATETs)   •   potential-outcome means (POMs)   •   continuous, binary, count, fractional, and survival outcomes   •    more
结构方程模型(SEM)
(SEM (structural equation modeling))
graphical path diagram builder   •   standardized and unstandardized estimates   •   modification indices   •   direct and indirect effects   •   continuous, binary, count, ordinal, and survival outcomes   •   multilevel models   •   random slopes and intercepts   •   factor scores, empirical Bayes, and other predictions   •   groups and tests of invariance   •   goodness of fit   •   handles MAR data by FIML   •   correlated data   •   survey data   •    more
潜伏组分析
(Latent class analysis)
binary, ordinal, continuous, count, categorical, fractional, and survival items   •   add covariates to model class membership   •   combine with SEM path models   •   expected class proportions   •   goodness of fit   •   predictions of class membership   •    more
多重估算
(Multiple imputation)
nine univariate imputation methods   •   multivariate normal imputation   •   chained equations   •   explore pattern of missingness   •   manage imputed datasets   •   fit model and pool results   •   transform parameters   •   joint tests of parameter estimates   •   predictions   •    more
调查方法
(Survey methods)
multistage designs   •   bootstrap, BRR, jackknife, linearized, and SDR variance estimation   •   poststratification   •   DEFF   •   predictive margins   •   means, proportions, ratios, totals   •   summary tables   •   almost all estimators supported   •    more
聚类分析
(Cluster analysis)
hierarchical clustering   •   kmeans and kmedian nonhierarchical clustering   •   dendrograms   •   stopping rules   •   user-extensible analyses   •    more
项目反应理论(IRT)
(IRT (item response theory))
binary (1PL, 2PL, 3PL), ordinal, and categorical response models   •   item characteristic curves   •   test characteristic curves   •   item information functions   •   test information functions   •   differential item functioning (DIF)   •    more
多变量方法
(Multivariate methods)
factor analysis   •   principal components   •   discriminant analysis   •   rotation   •   multidimensional scaling   •   Procrustean analysis   •   correspondence analysis   •   biplots   •   dendrograms   •   user-extensible analyses   •    more
数据[资料]管理
(Data management)
data transformations   •   match-merge   •   import/export data   •   ODBC   •   SQL   •   Unicode   •   by-group processing   •   append files   •   sort   •   row–column transposition   •   labeling   •   save results   •    more
绘图
(Graphics)
lines   •   bars   •   areas   •   ranges   •   contours   •   confidence intervals   •   interaction plots   •   survival plots   •   publication quality   •   customize anything   •   Graph Editor   •    more
图形用户界面
(Graphical user interface)
menus and dialogs for all features   •   Data Editor   •   Variables Manager   •   Graph Editor   •   Project Manager   •   Do-file Editor   •   Clipboard Preview Tool   •   multiple preference sets   •    more
参考资料
(Documentation)
27 manuals   •   14,000+ pages   •   seamless navigation   •   thousands of worked examples   •   quick starts   •   methods and formulas   •   references   •    more
基本统计
(Basic statistics)
summaries   •   cross-tabulations   •   correlations   •   z and t tests   •   equality-of-variance tests   •   tests of proportions   •   confidence intervals   •   factor variables   •    more
非参数方法
(Nonparametric methods)
nonparametric regression   •   Wilcoxon–Mann–Whitney, Wilcoxon signed ranks, and Kruskal–Wallis tests   •   Spearman and Kendall correlations   •   Kolmogorov–Smirnov tests   •   exact binomial CIs   •   survival data   •   ROC analysis   •   smoothing   •   bootstrapping   •    more
流行病学
(Epidemiology)
standardization of rates   •   case–control   •   cohort   •   matched case–control   •   Mantel–Haenszel   •   pharmacokinetics   •   ROC analysis   •   ICD-10   •   more
GMM与非线性回归
(GMM and nonlinear regression)
generalized method of moments (GMM)   •   nonlinear regression   •    more
其他统计方法
(Other statistical methods)
kappa measure of interrater agreement   •   Cronbach's alpha   •   stepwise regression   •   tests of normality   •    more
函数
(Functions)
statistical   •   random-number   •   mathematical   •   string   •   date and time   •    more
互联网功能
(Internet capabilities)
ability to install new commands   •   web updating   •   web file sharing   •   latest Stata news   •    more
社区编写的命令
(community-contributed commands)
community-contributed commands for meta-analysis, data management, survival, econometrics, more
编程特点
(Programming features)
adding new commands   •   command scripting   •   object-oriented programming   •   menu and dialog-box programming   •   dynamic documents   •   Markdown   •   Project Manager   •   plugins   •    more
矩阵编程-Mata
(Matrix programming—Mata)
interactive sessions   •   large-scale development projects   •   optimization   •   matrix inversions   •   decompositions   •   eigenvalues and eigenvectors   •   LAPACK engine   •   real and complex numbers   •   string matrices   •   interface to Stata datasets and matrices   •   numerical derivatives   •   object-oriented programming   •    more
嵌入式统计计算
(Embedded statistical computations)
Numerics by Stata




顺应大数据时代要求,自开展Stata培训以来,我司通过活动路演、创新讲座、在线课程、线下培训等系列活动已经在全国开展了包含Stata应用方法、统计分析、文本分析、数据分析、数据清洗、Stata、cURL交互与网络爬虫、内生性问题的方法及进展、Stata编程与Mata运算、Stata编程技术与爬虫、Stata自动化报告与可重复研究、计量经济方法及Stata应用等学习活动,有近千余名师生及业界爱好者参与了学习。通过此类学习活动极大的加强了大数据分析人才的理论和实践能力。推进了大数据人才培养,以及学术成果的转化,为大数据分析领域发展做出了贡献。我司希望通过每年一届的Stata中国用户大会,深度推进国内青年学者学习热情,提升高校学术交流氛围,整合学界及业内的大量资源,进一步提高数据分析能力和科学决策的水平。

2017-2018 China Stata Users' Conference 大会资源免费奉送,关注Stata的小伙半们抓紧时间领取咯!

第一届Stata中国用户大会概况


2017年“第一届Stata中国用户大会”(2017China Stata Users' Conference)是由北京友万信息科技有限公司和爬虫俱乐部,联合StataCorp LLC发起第一届Stata中国用户大会。首届Stata用户会议的宗旨是“沟通和合作”,我们希望通过定期举办Stata用户会议,形成中国用户之间的技术、经验交流平台;建立和Stata原厂的沟通机制,反映中国用户遇到的问题,让未来的Stata版本更多地反映中国用户的愿望;建立学界与企业界之间的沟通和联系,让Stata用户有更多的机会服务于企业界;打造数据分析领域的高端智库,服务于我国的大数据事业。


会议主题:Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata

演讲主题 演讲人
《Stata 15 新版本发布及新功能研讨》 彭华    StataCorp LP 软件工程总监
《内生性问题:方法及进展》 连玉君    中山大学
《putdocx与格式化输出》 李春涛    中南财经政法大学
《unicode与中文编码》 彭华    StataCorp LP 软件工程总监
《Stata函数》 彭华    StataCorp LP 软件工程总监
《Subinfile,网页源代码分析的神器》 薛原    爬虫俱乐部
《Stata自动化报告与可重复研究》 陈堰平    雪晴数据网
《分词与情感分析》 薛原    爬虫俱乐部
《文本分析在量化文史学研究中的应用—以<唐书>与<红楼梦>为例》 俞俊利    上海交通大学
《Stata、cURL交互与网络爬虫:以微博API为例》 彭文威    香港科技大学
《Stata数据清洗常用技巧》 彭文威    香港科技大学
《Econometric convergence test and club clustering using Stata》 杜克锐    山东大学

—> 前往下载大会资源


第二届Stata中国用户大会概况


2018年“第二届Stata中国用户大会”(2018China Stata Users' Conference)是由北京友万信息科技有限公司(简称:友万科技)主办,顺德职业技术学院承办的聚焦Stata应用与技术落地的盛会。会议核心内容将围绕计量经济方法及应用方向展开广泛的国际学术交流,内容覆盖经济学、金融学、会计学、计算语言学、新闻学、政治学、历史学、医药卫生等微观和宏观计量分析的热门应用领域。今年大会的主题是“Econometric Analysis Method and Application” 秉承“开放协作、技术共享”的宗旨,面对面真诚聆听用户的声音。致力于为业界带来最新技术、行业应用案例展示与最佳实践单元。



会议主题:Econometric Analysis Method and Application

演讲主题 演讲人
《大数据、高维回归与Stata》 陈强    山东大学
《Spatial autoregressive models using Stata》 Di Liu     StataCorp
《政策评估与因果推断:Stata应用概述》 王群勇    南开大学
《断点回归》 连玉君    中山大学
《回归分析集成输出解决方案》 李春涛    华中科技大学
《内含资本成本的计算》 顾俊    深圳大学
《样本选择问题与处理》 王群勇    南开大学
《DSGE在Stata中的应用》 许文立    安徽大学
《Report generation with putdocx, putexcel, putpdf, and dyndoc》 Hua Peng     StataCorp

—> 前往下载大会资源


活动起源


自开展Stata培训以来,友万科技已经在全国开展了包含Stata应用方法、统计分析、文本分析、数据分析、数据清洗、Stata、cURL交互与网络爬虫、内生性问题的方法及进展、Stata编程与Mata运算、Stata编程技术与爬虫、Stata自动化报告与可重复研究、计量经济方法及Stata应用等学习活动,有近千余名师生及业界爱好者参与了学习。通过此类学习活动极大的加强了大数据分析人才的理论和实践能力。推进了大数据人才培养,以及学术成果的转化,为大数据分析领域发展做出了贡献。在此期间,学者们多有反映因地域、距离、时间、交通、差旅等原因而影响学习质量和学习效率,为解决这一难题,也为进一步推广大数据分析人才培养的宽度和广度,自2018年起,友万科技开启了系列“Stata校园行活动”。


活动介绍


“Stata校园行活动”是为了促进Stata软件的应用、提高学员的学习质量和学习效率、推进大数据分析人才培养的宽度和广度,而开展的高校线下学习活动。内容覆盖经济学、金融学、会计学、计算语言学、新闻学、政治学、历史学、医药卫生等微观和宏观计量分析的热门应用领域。主旨顺应大数据时代要求,通过活动路演、创新讲座等系列活动的举办,深度推进国内青年学者学习热情,提升高校学术交流氛围,整合学界及业内的大量资源,进一步提高数据分析能力和科学决策的水平。

—> 前往了解详情

印刷书籍 查看更多


Generalized Linear Models and Extensions, 4th Edition

作者: James W. Hardin和Joseph M. Hilbe
出版商: Stata Press
版权: 2018
ISBN-13: 978-1-59718-225-6
页数: 598; 平装

A Gentle Introduction to Stata, 6th Edition

作者: Alan C. Acock
出版商: Stata Press
版权: 2018 ISBN-13: 978-1-59718-269-0
页数: 570; 平装

The Mata Book: A Book for Serious Programmers and Those Who Want to Be

作者: 威廉W.古尔德
出版商: Stata Press
版权: 2018
ISBN-13: 978-1-59718-263-8
页数: 428; 平装

Survey Weights: A Step-by-Step Guide to Calculation

作者: Richard Valliant和Jill A. Dever
出版商: Stata Press
版权: 2018
ISBN-13: 978-1-59718-260-7
页数: 183; 平装

A Course in Item Response Theory and Modeling with Stata

作者: Tenko Raykov和George A. Marcoulides
出版商: Stata Press
版权: 2018
ISBN-13: 978-1-59718-266-9
页数: 270; 平装

电子书籍 查看更多


Discovering Structural Equation Modeling Using Stata, Revised Edition

Alan C. Acock

An Introduction to Stata for Health Researchers, Fourth Edition

Svend Juul and Morten Frydenberg

A Gentle Introduction to Stata, Sixth Edition

Alan C. Acock

The Workflow of Data Analysis Using Stata

J. Scott Long

An Introduction to Modern Econometrics Using Stata

Christopher F. Baum

Stata Journal 期刊


Stata Journal为每季发行的期刊,包含了统计、资料分析、教学方法、有效地使用Stata语言及书籍回顾…等相关内容。 使用者亦可选择购买有兴趣的单篇文章。

ISI Web of Knowledge 的最新期刊引用报告,将Stata期刊列为社会科学数学方法类别期刊中的第四位,仅次于结构方程模型, 计量经济学和经济学与统计学评论。


点击了解更多相关期刊内容

Stata原厂相关链接


>>最终用户授权许可协议(EULA)

>>教学视频

>>在线培训
>>更多学习资源
>>官方博客