正文
在第
1-2讲中
,笔者会以一篇文章为实例,说明Stata的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。
第
3讲中
介绍
Stata编程的基础知识。但凡提及写程序,很多人都会产生恐惧心理,其实,一旦掌握了最基本的原理和语法格式,Stata中的程序设定并没有想象的那么困难。更为重要的是,对于多数人而言,由于并不需要写完整的ado文档,因此只需要学会最基本的条件语句和循环语句即可,难度又会进一步降低。
第
4讲
介绍实证分析中的模型设定和结果解释问题。很多人会觉得
OLS过于简单,但Top期刊中使用最多的仍然是OLS,如何合理的构建模型、解释结果便成为实证分析中必须掌握的。笔者精选了大家经常面临的几个专题并结合论文进行讲解,包括:虚拟变量的使用、交叉项的使用和解释、分组回归的合理设定和假设检验,还有在经济学和金融学中相对较新的R2贡献度分析。
第
5讲
介绍几种处理内生性问题的常用方法,包括传统的
IV-GMM估计,以及倍分法(Difference in Difference, DID)。掌握这些方法有助于大家合理控制内生性问题,以便得到更为可信的结论。
第
6讲
通过
Monte Carlo模拟介绍时间序列的基础知识,包括AR过程、MA过程,以及ARIMA过程的时序特征;白噪声和随机游走过程的时序特征,以此为基础介绍伪回归和协整分析的相关理论;GARCH模型的基本原理和时序特征。通过这些内容的学习,对于估计和分析时间序列模型有很大的帮助。
第
7讲
介绍了目前广泛应用的面板数据模型。由于面板资料的获取越来越方便,目前多数研究中使用的都是面板数据。在讲解这些模型的基本思想和估计方法的过程中,笔者会将重点放在模型含义和应用范围上来。例如,对于同一笔数据而言,何时采用
OLS进行估计,何时采用FE估计?不同的方法之间有何差异和关联?结果背后的经济含义如何解读?
第
8讲
介绍论文写作与发表相关的一些经验。作为南方经济的责任编辑,经济研究、金融研究等期刊的匿名审稿人,以及学位论文的评阅人,我发现很多论文虽然有很好的想法,但往往因为如下原因而无法通过评审。其一,缺乏严谨规范的文献综述,使得读者难以判断文章的学术贡献;其二,实证分析部分虽然使用了比较前沿的方法,但基础工作不够扎实,如研究设计不合理、样本的筛选过程不严谨、离群值未妥善处理、结论的稳健性值得怀疑等;其三,实证结果的呈现方式不妥,论文的排版不够精致,对于专业术语的表述不严谨,结果的分析不深入等。为此,在本讲中,我将主要介绍如下两个个问题:一是如何收集、管理和研读文献;二是如何投稿、修改和发表论文。