来源:2021年麻省理工学院中国创新与创业论坛年会
演讲人:Lauren H。 Cohen 哈佛商学院Lauren H。 Cohen教授,NBER研究员
How Artificial Intelligence is – and is not – Changing Investing
Lauren H。 Cohen L.E。 Simmons Professor from Harvard Business School & NBER Research Associate
今天我要谈论人工智能,但这不会是通常的人工智能话题。事实上,恰恰相反。我要谈谈我所看到的挑战,包括在整个金融领域的人工智能的实施。我的专长实际上是行为金融学和最佳创新政策的交叉点。使我能够在世界各地开设课程并开设高管课程,就金融、创新、政策和家族官员等问题向众多政府、对冲基金提供咨询。
首先是一个热身话题,但也是跟今天的主题非常相关的。这与一场意外有关。这项研究几周前刚刚发布。澳大利亚发生了一系列可怕的毁灭性火灾,烧毁了大量澳大利亚森林。2019年,它在燃烧了7.4万平方公里的土地后,释放了约7000亿吨二氧化碳。现在,他们认为这是一场可怕的、可怕的环境灾难。但事实证明,最近发表的另一篇论文发现,燃烧时产生的颗粒实际上是前所未有的重要。这些出来的颗粒比以往任何时候都大。所以实际上浮游植物吸收了大部分的二氧化碳。在这方面,对环境的净影响是相当温和的。所以它只是显示了这种意想不到的后果。你永远无法想象这些细节会以这种方式反馈,然后它们基本上会相互抵消。对于些金融科技创新也有着同样的想法。这些意外后果的影响实际上为零,甚至可能让我们对这些创新如何实际影响行为和福利持否定态度。
为了理解AI机器学习,试图做什么,我们需要从头开始,最开始是随机性。为了理解随机性,我们需要了解我们为什么要理解随机性。宝宝们哭泣时,他们会得到他们想要的。事实证明你也明白这一点。如果你在接受采访,你给出了一个确定的答案,那么你更有可能得到你想要的东西,并且你改变了你的行为 - 你的识别模式改变了你的行为。
事实证明,人类大脑会自然地搜索这一点。我们很擅长它,但我们过度适应了这一点。所以我们过度拟合了它,因为生活的大部分时间都是随机的,我们并没有完全理解这种随机性。特别是,在心理学、社会心理学和判断决策中有很多这样的例子,我们看到随机的事物,我们认为我们看到了这种模式。在随机抛硬币的时候,我们看到三个人头。我们认为我们做对了。我们过度解释了硬币有偏见的可能性与实际合理预期的事实,即使硬币是公平的。现在尤其是投资者在谈到金融时,大脑往往是这样思考的。所以我们说,如果我们拥有所有数据,我们就会获得更多数据。投资者认为我们缺少的只是数据。如果我们得到数据就可以完全适应这些流程,我们可以完全适应市场的金融复杂性。那是贬低随机性的作用
举一个尖锐的例子。如果我要给你一个变量来解释过去 10 年机器学习模型中可能出现的最大变化,它会是什么?你们中的许多人可能会说看看那里的市场,让我把我能想到的其他变量放进去。看利率,货币走势,看油价。都错了。一个可以解释的变量是最近的冲击。金融市场回报的差异由最近房屋市场在巨型市场中 40% 的大规模变动来解释。然而根据定义,这在 2017 年是随机的,机器学习模型无法预测。它只是向您展示随机性规则、变化。拜登总统或习主席或总理明天要说什么?他们不知道,因为他们正在对市场上的事物做出反应,他们也无法预测。然而,这些都是资产价格的巨大驱动因素。那么市场上什么是重要的呢?结果是非常适中的百分比。我可以给你所有的数据让你提供你的机器学习模型。也许你可以预测 20% 的未来变化边缘,也许是 25%。而它并没有接近我们尝试适应的 100%。然后我们构建模型,构建模式,识别过度拟合这些系统的人工智能系统。大概是在 8 年前,推特预测股市将发生大规模革命,甚至有论文发表说他们利用推特上的情绪来预测股市将彻底改变金融。事实上,有一些对冲基金就是以此为基础开始的。我们只是利用市场的情绪,但是数以百万计数以千万计的人为此付出了代价。所有新闻媒体报道第一个月Twitter都跑赢了市场,这正是我们告诉你会发生的事情。 Twitter 现在正在接管金融市场。如果我们回到这篇论文,摘要说的是,通过使用推特情绪我们几乎可以在 90% 的时间里预测市场明天的走势。
我用两件事开始训练你的思维。第一个,你可以预测明天的市场,你将会是亿万富翁,可以买国家,可以买行星。这些都是世界上流动性最强的商标。如果你真的能预测像你一样获胜的市场,你就是人生的胜利者。第二,当你使用 24 天或者 8 天前的推特中心的东西时 - 这是一个危险信号,表明那里正在发生某种过度拟合。机器过度解释这些数据,机器建立这种直觉,就像人脑一样过度模式识别。
下一个例子,财富管理。金融科技涉足财富管理,前端优化。有人说,我们要接替财务顾问了,你不需要任何一家财务顾问,机器人可以做。这应该再次说明了购买金融服务的深度。我们为什么要付钱给一个人?机器人可以做什么并且做得更好?事实证明,他们确实在早期获得了一些资产,并且开始加强构建。但自那次爆炸性增长以来发生了什么?他们趋向平缓。这些完全失去了改进空间。归根结底,信任是一个巨大的问题。
所以这里是开放性问题。信任在金融科技中的作用是什么?重要在哪里?哪里不重要?因为没关系。了解信任在哪些市场中重要,哪些标志不重要,这是思考金融领域科技未来的一个超级关键点。其次,将要在哪些地理区域完成?我们已经看到中心从美国转移到亚洲,继续走向非洲。正确地做到这一点将使您能够正确定位自己的人力资本。
最后一个例子,房地产税。房地产技术领域有很多应用程序和初创公司。现在声称我们可以用手机拍下这个房间的照片,弄清楚它有多大。我们甚至可以看各种便利设施。你可以想象这些设施有什么作用?问题是许多实地验证表明它们非常糟糕。我们并还没有与这种技术那么接近。我们只是接近一小部分。事实上,我们仍然处于尝试使用机器学习技术的地步。所以我们还没有接近可以告诉我们房子里的特定设施并开始使用它的地步。但是这并不能阻止一家公司加入并尝试使用人工智能机器学习这个领域。
所以我希望你们谨慎行事。这是可以做到的,但你必须仔细、系统地去做。哪些金融领域最有可能被金融技术成功颠覆?我刚刚向你展示了非常不稳定的例子 - 房地产行业已经发生了。但是并不意味着它永远不会被突破。需要考虑的是,哪些特征将推动这一点。是信任吗?是随机性的数量还是该市场中可预测的变化?价格?监管?还是定价过程的其他方面吗?
所以最重要的是,我希望你做三件事。
首先,随着科技创新步伐的加快,很多金融行业将被科技改变甚至取代。例如央行数字货币即将问世。这正在推动我们在新的领域开展业务的方式。
其次,在一个技术应用领域取得成功并不意味着在其他领域同样也会取得成功。就像那些很有吸引力的应用程序一样,他们看上去似乎很精彩,他们可以预测价格。但是这并不具备很好的证据,我们还不能完全这样做。
第三,自80年代以来,许多资源和公司经历了生死存亡,不断试图将人工智能机器学习等应用于金融领域,不仅仅是从未听说过的小公司,甚至也有像高盛这样的公司,他们被高度激励,投入大量资源而无法做到这一点,让我们从这个过程吸取教训。但是并不意味着我们不能做到,如果我们要做到,我们需要认为这是提高我们学习曲线的必要部分。我们将站在那些巨人的肩膀上说,现在我们要了解他们做错了什么并思考我们需要以怎样不同的方式去做。我们今天甚至可以知道他们从未做过这样的事情。这就是为什么我们会成功,他们会失败。我们高度纪律化的技术和有针对性的应用总是获胜。我们需要清晰知晓我们试图解决的问题,为什么我们要用技术解决这个问题?而过去所有被高度激励和投入资源的参与者却无法做到。
Q&A
人工智能可以对房地产行业产生积极影响的最简单的结果是什么? 未来几年的商业模式会是怎样?
这是一个很好的问题。这就是我想说的可以做的。有些公司已经开始着手这方面的工作,但还有更多工作要做。房屋买卖过程中的大部分过程是极其艰巨和浪费时间的。所以我昨天刚刚会见了一家总部位于瑞士的公司,该公司正试图在这个领域进行创新,把它放在区块链上,但它其实甚至不需要放在区块链上。在很多国家它实际上是在纸上完成的。我必须得到某个标志,得去找某个人,必须得到这个,现在必须有人进来检查房子,检查员盖章。如果我们既可以制作电子版又可以将它放在平台上,然后让智能合约执行它 - 在完成这些事情之前这笔钱不会被释放出来。我们可以摆脱这些低效的程序,进而使得房屋买卖过程的中成本大幅下降。而现在交易成本本身就是荒谬的。考虑到我们现在的社会状况,这个成本太高了。所以如果你问我最简单的成果,而且这种成果几乎无处不在,它需要被某人抓住,你可以马上建立你的公司。
当你谈到使用 Twitter 来预测市场价格时,我想知道除了机器学习模型的可能性之外,或者出于某种原因崩溃,还有什么其他的原因?正如很多公司或现金基金或银行,他们知道模型的工作原理。 所以他们都应用相同或者相似的模型。 这样每个人都将模型应用于市场之后,或类似的好处就会消失。我想知道除了这种模式本身,还有其他可能吗?
是的。在市场上的确有一些例子。有常见的套利价差然后崩溃。所以这些是曾经存在。当人们开始交易它们时,会看到价格引用。如果价格应该是 100,并且有足够多的人知道应该是 110,那么我们快速交易,价格从 100 迅速上涨,更多的人知道它,上涨的速度越快。事后你可以查一下,但正是这个想法,在盈利之后,公司过去常常朝着同一个方向漂移,你介入了 3 个月。而现在往往不到 2 或 3 周,正是因为越来越多的人知道它。他们的交易速度非常快。在这里,没有证据表明确实有效。当你应用这些模型时,它是一台机器对特定时间段的数据过度拟合模式。这是当月的过度拟合和错误拟合。
机器学习模型很棒。这篇论文本质上来自计算机科学与工程师和计算机科学与工程,以及机器学习,当你想要适应封闭系统时,这是一个超级强大的工具。想像你在制造一台机器,你有一个宽容度,什么都没有改变 – 相同的机器,相同的要素,相同的条件,相同的金属片,相同的合金。在这种情况下,我们只是试图一次又一次地做到这一点。你可以从 99% 到千分之九百九十九。机器学习在这些方面非常棒。但这真的很糟糕,当你预测非常创新的系统会发生变化并且它们以非常不可预测的方式发生变化时,它真的可能朝着错误的方向前进。所以我举这个例子。这就是为什么如果现在要预测你将如何参加下一个会议,社会科学和这种做市商做起来很难,而我去预测应该很容易,对吧?好像是一回事。这甚至不是你一天剩余时间在做什么,你如何进入下一个对话。我的模型几乎肯定适合,因为它无法识别的是你口渴了所以你想去买一杯零度可乐,或者你看到一个朋友你想与之交谈,或者因为你想看到另一座建筑物所以你决定走另一条路。我不可能把它放在我的脑海里,因为这一路上可能发生很多创新。因此,鉴于这些变化如此之多,塔无法预测你将如何走到下一个会话,如何互相适应,如何进行交易,以及所有交易和聚合在一起形成一个价格。这是一个非常艰难的过程。
因此,这并不是模型的失败,因为没有多少人知道该模型。我们只是聚合了它然后Alpha 崩溃了。它从一开始就没有奏效,但并不是不可能奏效,只是我们必须始终牢记这个目的只是模式识别。仅采用过去的模式并预测未来,例如预测金融市场,通常听起来就足够了。过度拟合永远不会复制的数据部分,事实上把我们放在了错误的方向上,因为当另一个数据出现并推向另一个方向时,它看到了这些模式和我们将要移动到那里的东西。