专栏名称: 新财富投研圈
新财富投研圈是基于新财富十余年各类品牌评选推出的资本圈活动平台,针对资本圈高端群体,3000家上市公司、新三板、34个研究领域的1600家分析师及一级、二级市场专业投资者机构等沟通互联的系列线上线下的活动。
目录
相关文章推荐
51好读  ›  专栏  ›  新财富投研圈

打开中短期市场的“黑箱”——基于机器学习的ETF投资研究

新财富投研圈  · 公众号  · 财经  · 2021-03-02 19:17

正文

请到「今天看啥」查看全文



图1:公募基金的“赢家诅咒”现象

资料来源:Wind、招商银行研究院


“赢家诅咒”现象是中短期市场难预见性的体现之一,而为何难以预判?我们认为根本原因在于认知偏差。根据认知科学的核心观点,心智的计算-表征理解(Computational-Representational Understanding of Mind)是对思维最恰当的理解,换言之,人类思维实则是逻辑、概念、规则、类比、表象、联结这六种代表性心理表征的计算过程,而人类思维在处理短期股市变化该类问题时,心理表征的计算过程存在不同程度的偏差,可能原因有三:


其一,相较于长期变化,中短期市场易受短期事件冲击影响,而每个个体受自身学习经历、工作环境、监管政策、可得信息等方面的综合影响,对信息的评估存在不同程度的偏差,进而体现为交易行为的不同;


其二,投资者对高维数据信息的理解和利用并不充分,人的决策过程偏线性化。最为直观的体现之一就是认为中短期市场可能服从某种规则(如技术分析),虽然这种方法时而有效,但容易陷入局部极值(典型例子即是“抄底抄在半山腰”)的困境。线性化思考过程容易忽略大量非线性数据的关联,如某类事件的出现可能引发其他因子之间的变动,使得长期规律(如现金流贴现模型等估值框架)难以刻画短期股价变化过程;


其三,人的决策不可避免地受到身心状态的影响,从而表现出一定程度的“非理性”,如业绩考核压力加大、投资规模大幅度变化等情况下,因投资者身心状态产生较大变化而出现的非理性表现。


因此我们推测,中短期市场难预知的特性,背后所反映的可能是某些尚未被发现、理解、定价的市场特征,由于人类思维的局限性,譬如归纳与演绎推理并非万能,使得该类特征难以被察觉。相对于人类思维的局限,近年以来发展较快的机器学习提供了一定程度的优化方法,本文将通过搭建机器学习投资体系,以期弥补人类大脑在高维数据处理与线性思维的不足,尝试观测市场短期变化的特征,进而提供投资策略的新思路。


机器学习的前世今生


提及机器学习,人们可能立刻想到的是大量的复杂算法模型,但其实要理解机器学习并非难事,抛开过于学术的定义,以挑选橘子场景为例便可知晓一二。


生活中的经验告诉我们,表面有小斑点、颜色鲜黄的、个头中等的橘子是甜的概率较大。当机器被赋予“有斑点+鲜黄+个头中等=甜”这类规则之后,给定同一个橘子,不同的人和同一机器进行多次判断该橘子甜还是不甜,在较成熟的机器学习体系下,被机器认定为甜橘子的概率应与被人认定为甜橘子的概率相近。此外,基于特征做判断的机器学习还可以分离出特征的相对重要性,例如当遇到颜色鲜黄、个头中等但无斑的橘子时,缺乏经验的人在短时间内可能难以做出正确判断,但机器通过分析可能认为,表皮颜色对甜度的影响更大,因此即使没有斑点,机器也倾向于认为这是个甜橘子。


上述例子简单展示了机器与人在特定任务处理上的异同之处,下文将通过回顾机器学习的过往发展,对当下的应用场景(如投资领域)做出简介,进而介绍投资决策中融入机器学习的优势。


(一)机器学习的发展历程


机器学习萌芽于20世纪40年代,以模仿人类神经元的连接为起点,彼时,需要依赖相关学习规则才能高效运作,最典型的规则之一为 “Hebbian规则”。由于Hebbian规则属于无监督学习,故在处理大量有标签分类问题时存在局限。随后,前向人工神经网络(感知器)诞生,开启了有监督学习的先河,并被广泛应用于文字、声音、信号识别、学习记忆等领域。20世纪60年代中叶至70年代中叶,机器学习的发展进入停滞期,一批学者对感知器效果提出严重质疑。1985年,应用于多层神经网络的学习规则——误逆差传播算法(BP算法)推动了人工神经网络发展的第二次高潮。除了BP算法,包括SOM(自组织映射)网络、ART(竞争型学习)网络、RBF(径向基函数)网络、CC(级联相关)网络、RNN(递归神经网络)、CNN(卷积神经网络)等在内的多种神经网络也在该时期迅猛发展,标志着机器学习的复兴。


图2:机器模型发展历程概览

资料来源:招商银行研究院


当前,机器学习的焦点集中在集成学习和深度学习。虽然方法论随着时间变迁,但是机器学习的本质始终未偏离图灵在1947年伦敦的演讲中提到的那句话,“What we want is a machine that can learn from the past experiences.”(我们想要的是一台能从过去的经验中学习的机器)。从应用场景来看,随着机器学习的平台不断扩张,机器学习算法已经应用到诸多领域,以股票市场为例,涌现出了不少著名机构投资者,如文艺复兴科技公司(Renaissance Technologies)等先驱,通过不断创建、改良算法模型,创下令人瞩目的成绩,其内部代表作大奖章基金(Medallion Fund)在1988-2018近30年的时间内费后年化收益率高达39%,远超索罗斯(1969-2000,费后年化32%)、科恩(1992-2003,费后年化30%)、巴菲特(1965-2018,费后年化21%)、达里奥(1991-2018,费后年化12%)。


图3:机器学习应用广泛

资料来源:招商银行研究院


(二)投资决策中融入机器学习的优势


从前文提到的挑选橘子问题中可以发现,在做决策中融入机器学习可能具有相对优势。类比电脑,人类大脑就像块CPU,虽然强大,但在同时有效处理多个任务的问题上存在明显的不足之处,即我们常说的“一心不能二用”。而电脑则有两颗“大脑”,一个是CPU,另一个则是GPU,串行与并行的计算方式赋予了电脑在较短时间内对高维数据快速处理的能力。简而言之,机器和人脑本质上都是优化器,当任务维度增加时,人脑往往可能会顾此失彼,但机器求最优解的能力更强,犹如在复杂地形中能更准确的寻找到全范围内最高的山峰或最低的洼地,即更容易得到非凸(Non-convex)的全局最优解。


图4:机器学习与人类学习对比







请到「今天看啥」查看全文