专栏名称: 计量经济圈
记录一个我们生活在其中的时代社会,囊括的主题如下:经济、社会、世界和计量工具。
目录
相关文章推荐
神嘛事儿  ·  我回答了 @鹅城奔奔 ... ·  昨天  
第一财经  ·  近150亿!深铁再向万科“输血” ·  昨天  
凤凰网财经  ·  带着1100亿负债,河南首富又要IPO了 ·  昨天  
经济观察报  ·  中企出海,先上云 ·  昨天  
51好读  ›  专栏  ›  计量经济圈

谁说经济学没用? 美国经济学会主席AER长文: ECON的“神来之笔”正在改变数字世界.

计量经济圈  · 公众号  · 财经  · 2025-04-06 12:08

正文

请到「今天看啥」查看全文


产品设计不仅涉及对用户需求的理解和满足,还常常涉及到软件设计的具体要素。例如,经济学家可能会参与决定软件模块化的程度,以及是否向公司内部数据分析师开放参数调整的设置(通常被称为“旋钮”、“刻度盘”或“杠杆”),以便根据实际情况进行灵活调整和优化。
在本文第六.A节的案例中,PayPal 的慈善捐赠平台会向用户展示一系列建议的捐款金额。这些金额的设定并非随意,而是实验设计中的关键干预手段,其制定综合考虑了对历史用户行为数据的分析以及行为经济学的相关洞见(Athey 等,2024)。
2. 市场设计师
市场设计师的角色涉及创建和选择合适的干预措施,以塑造特定市场的运作方式或个体之间的互动行为。市场设计是经济学文献中的一个重要领域,受到了广泛的讨论和研究(例如,Roth,2002,2018;Milgrom,2021)。经济学家通过设计市场规则、交易机制和激励机制等,旨在提高市场效率、促进资源优化配置并实现特定的政策目标。
本文第五.A节的案例展示了 Athey 等(2022a)如何研究搜索算法的排序策略对在线小额信贷平台资金分配决策的影响。研究结果表明,引入基于计算机视觉提取的照片特征(例如微笑)可能会在平台的效率与公平性之间产生一定的权衡,这为市场参与者理解算法设计对市场结果的影响提供了重要的启示。
3. 流程设计师
流程设计师负责设计和优化创新过程本身,这涵盖了资源分配决策、实验选择机制以及组织结构的设计等多个方面。其目标是建立高效、灵活且能够持续产生创新成果的机制。
例如,一个实验平台的架构设计将直接决定其能够自动输出的分析类型(例如,子样本分析)、是否支持进行长期实验以及用户是否能够始终保留在同一个实验组中,从而影响实验的效率和可靠性。流程设计还需要建立干预措施类型与相应的评估方法之间的清晰映射框架,确保能够采用恰当的方法来评估不同类型干预措施的效果。
例如,对于可能存在“溢出效应”的教育干预措施,建议在学校层面而非学生层面进行随机化分组,以避免个体层面的随机化可能导致的结果偏差。平台架构的设计还会直接影响到可行的实验类型以及所需的资源投入(例如,核心软件开发人员或专业数据科学家的数量)。
4. 实证分析设计师
实证分析设计师的角色主要利用历史实验数据或观察性数据来评估潜在干预措施的效果,从而在众多的干预方案中优先选择最有效的方案。他们运用严谨的计量经济学方法,从数据中提取有价值的信息,为决策提供科学依据。
例如,通过分析历史数据,可以识别哪些用户群体对类似的干预措施反应更好或更差。经济学家在此基础上制定详细的实证分析计划,并运用观察性数据或自然实验等方法来获得可靠的因果推断结论。
同时,还可以评估反事实政策的潜在收益,并设计最优的目标干预策略(参见 Athey & Wager,2021;Zhou,Athey & Wager,2023)。在数据资源相对稀缺的情况下,设计师需要有效地整合来自多个不同来源的数据、相关的理论模型以及已有的估计结果,以提高分析的准确性和可靠性。
5. 结果指标设计师
结果指标设计师负责将高层次的抽象目标转化为具体且可衡量的变量或变量函数。这些指标是评估干预措施效果的关键依据,并在业界和学术界有多种不同的称谓,例如评估指标、统计量、关键绩效指标(KPI)等。
设计有效的结果指标需要仔细考虑以下几个方面:如何合理地聚合观察到的变量以及确定它们各自的权重,以准确反映所关注的目标;选择合适的聚合层级(包括时间和对象的维度),以便在适当的粒度上进行评估;确保指标具有良好的信噪比,能够清晰地反映真实的变化;以及清晰地理解不同指标所对应的潜在影响机制,避免指标选择的偏差。指标的选择将直接影响到实验所需的规模以及创新的速度。
文献中已经存在许多关于创新指标设计的案例,例如公众物品价值的或有估值(Mitchell & Carson,2013)、社会网络信息的问卷设计(Banerjee 等,2019)以及复合指标的构建(Angrist 等,2020)。本文中相关的案例包括:利用问卷调查来衡量反虚假信息教育课程的影响(Athey 等,2023b;Offer‑Westort,Rosenzweig & Athey,2024)以及通过分析 LinkedIn 个人资料的更新情况来评估职业转型项目的效果(Athey & Palikot,2022)。其他案例(例如 Athey 等,2022a,2023c,2024)则重点关注在多个指标之间进行权衡,以更全面地评估干预措施的影响。
6. 复杂实验设计师
复杂实验设计涉及到人力资源和实验参与者的合理配置决策,从本质上来说是一个资源分配问题。经济学家在分析此类问题中涉及的目标和权衡方面具有独特的优势,能够综合考虑成本、收益、伦理等多方面因素。实验不仅用于评估产品设计的创新成果,还可以为未来的创新提供重要的指导,因此在整个创新循环中占据着核心地位。
实验设计的主要内容包括:确定实验的结构(例如,是在个体层面还是群体层面进行随机化分组),以适应不同的干预措施和研究问题;选择合适的实验结果指标,确保能够准确衡量干预效果;确定实验的持续时间,以便观察到长期效应;以及制定详细的实验后数据分析计划,确保能够从实验数据中获得可靠的结论。实验复杂性的来源多种多样:例如,当实验单元在网络或市场中存在相互作用时,可能会产生“溢出效应”或“干扰效应”,使得传统的独立性假设不再成立。
本文第一.A节描述了一个案例:为了鼓励阅读,在学校层面而非学生层面进行竞赛干预,以避免学生层面随机化可能带来的溢出效应(Agrawal 等,2023)。在营利性场景中,Masoero 等(2024)设计了一个买卖市场的实验,其中买家和卖家同时进行随机化分组,以研究双边市场中的复杂交互效应。
另一个复杂的实验案例由 Offer‑Westort,Rosenzweig & Athey(2024)提出:他们设计了一种自适应实验,旨在从文献中提出的众多干预方案中学习最优的方案,并进一步学习最优的目标化干预分配策略,以便根据个体的特征将其分配到预期收益最高的实验组,从而实现个性化的干预效果。
本文将在后续部分更详细地讨论这些以及其他复杂性的来源,重点展示经济学工具(包括理论和计量方法)如何应对这些设计挑战,并指出该领域中仍然存在的若干开放性研究问题。
B. 经济学家面临的六个跨领域挑战
在阐述了经济学家在创新周期中的六种设计角色之后,现在作者将讨论经济学家在数字产品创新过程中面临的六个普遍存在的跨领域挑战。这些挑战贯穿于创新过程的多个阶段,并对各种设计决策产生深远的影响。
第一个挑战:结果衡量标准的根本性权衡
在设计和选择结果衡量标准以及基于这些标准制定决策规则时,我们不可避免地面临着根本性的权衡取舍。理想情况下,一个单一的衡量标准应该同时具备以下特性:能够及时观察到变化;对相关的干预措施足够敏感;具有理想的信噪比,能够清晰地反映真实效果;并且能够全面捕捉干预措施(包括其所有作用机制)的真实社会影响。然而,现实情况往往是,那些容易获得且能够及时反馈的衡量标准往往会遗漏许多重要的长期或间接影响渠道。因此,结果衡量标准的选择对整个创新过程的方向和效率至关重要。
当决策直接依赖于这些衡量标准时,它们会深刻地影响组织内部人员的激励机制,进而塑造研发的方向和性质。正如Gosnell, List, 和Metcalfe(2020)所精辟地指出:“衡量什么,就改进什么。” 这意味着,为了支持有效的决策制定,衡量标准需要能够捕捉到决策过程中不同参与者所关注的关键概念,因此往往需要采用多个不同的衡量标准。
针对上述问题,可以采取多种策略和方法。例如,考虑一种常见的情况:一项干预措施可能对不同的结果产生相互冲突的影响。Athey等(2022a)和Athey等(2023c)对在推荐系统中实施个性化时,效率与公平之间的权衡进行了深入分析。Athey等(2024)则研究了慈善机构在线筹款时,在吸引更广泛的捐助者群体和短期内筹集更多资金之间存在的权衡。
这三项研究都建议构建一个类似于经典经济学中生产可能性边界的“可能性边界”。在这个边界上,不同的创新决策将导致两个关键结果的不同预期值。第七.A节将提供关于如何构建和利用这种可能性边界的更详细说明。以这种方式呈现研究结果本身也是一种重要的设计选择;另一种替代方案是预先设定不同结果的权重,然后简单地分析其加权平均值。
然而,在以复杂的权衡为特征,且不同决策者可能对如何解决这些权衡持有不同偏好的情况下,呈现可能性边界能够有效地促进组织内部的决策过程。此外,它还可以确保产品设计师充分关注潜在的权衡,因为巧妙的设计决策(例如引入个性化功能)有时可以有效地缓解这些权衡(参见Athey等,2024)。
第二个挑战:干预措施的长期均衡效应
虽然干预措施可能直接影响个体及其短期结果,但其长期影响往往包含复杂的均衡效应。这是因为随着时间的推移,个体的信念会发生改变,其他市场参与者也会相应地调整其行为。一些效应可能会进一步增强和扩大干预措施的积极影响,而另一些效应则可能逐渐减弱甚至完全逆转最初的积极效果。在短期的实验中, 们可能难以甚至无法全面衡量所有这些长期效应,因此需要借助经济模型和启发式方法来补充对实验数据的实证分析。第五.A节提供了一个关于如何对均衡效应进行建模的案例。
第三个挑战:数字产品干预措施空间的高维度和复杂性
与数字产品相关的潜在干预措施的范围极其广泛且复杂。在数字产品的开发环境中,通常可以以较低的成本快速生成大量干预措施的变体。在这种情况下,创新面临的一个主要限制因素是缺乏足够的真实用户来对这些变体进行充分的测试。
然而,这个挑战也为 们提供了利用模型来推广不同干预措施效果的机会,以及采用更复杂的实验设计(例如自适应实验,在这种实验中,表现不佳的干预方案可以被及时淘汰)的机会。在一个具体的案例研究中,Offer-Westort, Rosenzweig, 和Athey(2024)利用自适应实验和析因设计,对大量旨在减少健康领域虚假信息传播的干预措施进行了测试。
第四个挑战:解锁个性化和定向干预的潜力
基于个体特征实现干预措施的个性化和精准定向,能够带来显著的效益。有效的目标定向能力极大地提高了设计那些对某些个体有益但对其他个体可能中性甚至有害的干预措施的回报;更广泛地说,它使得为每个个体提供最符合其特定情况的产品或服务成为可能。
正如作者在下文中将更详细论述的那样,个性化是开发多种替代性干预措施的重要补充;更正式的讨论请参见Sverdrup等(2023)。然而,在数据有限的情况下,如何使定向策略有效地发挥作用是另一个重要的挑战。在某些情况下,引入外部或不同的数据来源,或者整合来自不同研究的结果,可以帮助 们克服这一挑战。
第五个挑战:效率与公平的权衡
在社会影响领域提供数字服务时,决策者通常非常关注如何在追求效率的同时兼顾公平或分配后果。有几种方法可以应对这一挑战。首先,可以利用个性化和定向策略来缓解效率与公平之间的潜在冲突;如果一项创新对某个特定群体没有明显的益处,那么可以通过定向分配的方式避免该群体接收到这项创新。
其次,尤其是在资源或容量受限的情况下,可以利用因果推断的方法来估计那些优先考虑特定群体或旨在改善公平的反事实政策可能产生的影响。第二.B节和第五.A节提供了关于这种思路的具体应用案例。此外,如前所述,呈现可能性边界的策略对于改善围绕效率与公平权衡的决策过程也非常有帮助。
第六个挑战:战术性创新与可推广知识创造之间的张力






请到「今天看啥」查看全文