正文
对于核心解释变量——新增法律条款数,作者首先使用句子分词工具(sentence tokenizer)从法律文本中提取句子。随后,作者使用语言依存方法(syntactic dependency parser)确定句子是否属于法律条款并加以分类。
在分类过程中,作者将情态动词分为强制性(shall,must)和许可性(may,can)、将动词分为限制类(forbid,ban)和许可类(allow,permit),从而将属于法律条款的句子分为四类:授权(delegation)、限制(constraint)、许可(permission)和权利赋予(entitlement)。
以授权类条款为例,授权条款句式为“强制性情态动词+主动态动词+非否定形式”或“非许可性情态动词+授权动词+非否定形式”。例如“The worker shall act...”即属于前者,“The worker is expected to act...”属于后者。
确定法律条款数量以后,作者使用LDA(Latent Dirichlet Allocation)主题模型将法律条款分类。在正文中,作者将条款分为了18类主题从而制作“Shift-Share”工具变量。
基于美国1965–2012年的州级面板数据,构建线性模型:
其中,被解释变量代表州内实际人均生产总值,取对数后做差分处理;解释变量代表新增法律条款数,取对数处理。同时,控制了州和时间的固定效应并将标准误聚类到州层面。此外,本文还控制了每个州的长期趋势,从而得到立法产出对经济增长的净效应。最后在稳健性检验中,作者加入各类控制变量进行检验。
除州内实际人均生产总值外,作者还考察了其他经济产出,如基础设施建设、就业和实际生产总值的增长,数据来自BEA Regional Accounts。法律数据来自各州颁布的《州议会法律汇编》,其他数据主要来自已有文献。
在正文中,作者将法律条款分为18类(K=18)制作工具变量,即:
其中,Share为各州1955-1964年各主题的法律条款份额,Shift是剔除自身后其他49州该主题的法律条款数量的均值。分主题计算Share和Shift并相乘后,将18个结果相加,从而得到州层面的工具变量。
该工具变量体现了“法律扩散”这一学术概念,并有大量文献提供的经验证据加以支撑。已有研究强调立法者颁布新法案存在起草成本,从而倾向于参考其他州的已有立法。在借鉴过程中,立法者会重点关注其他州的成功立法,从而作为本州的立法参考。