Numerai, 对冲基金的未来?

Numerai, 对冲基金的未来?

Jams Simons (文艺复兴科技的创始人,旗下的大奖章基金是历史上回报率最高的基金之一,除去管理费,为每年66%),曾说过文艺复兴公司高额回报的秘诀:

If you’re going to trade using models, you just slavishly use the models. You do whatever the hell it says no matter how smart or dumb you might think it is at that moment and that turned out to be a wonderful decision.

如果你要使用模型策略来进行交易,你就要像奴隶一样执行它的指令。不论交易的指令看起来有多么聪明或愚蠢,你都要坚定不移地去执行,而这结果成为我们最聪明的决定。

不论是文艺复兴公司的model,还是桥水基金(管理着全球规模最大的资产)Ray Dalio经常提及的principle,他们都是利用机器模型决定交易的领先者。而正是利用模型策略所带来的无可比拟的优越性,帮助他们打败了其他的交易公司,更快的占领市场。

人是会变化的,可能今天仅仅因为在家里和孩子发生争吵,就严重的影响人类决策的准确性。而且这种多变也会让策略的修改变得异常的困难,因为当你无法保证在相同的情况下可以获得相同的结论时,改变就无从下手。

而机器就从来不会面临这样的问题,机器是精准的,不论多少次执行同样的指令,都会得到相同的结果。因此,通过回溯测试(通过对历史数据的预测不断修正模型),就能够大幅提升机器预测的准确性。

事实上,文艺复兴公司的交易员都没有金融背景,他们是数学家,计算机科学家和物理学家。正是因为科学家对建模的擅长,因此模型策略也为他们带来了巨大的回报。

模型策略取代人类策略的浪潮造就了这些新兴的公司和巨大的收益。

现在,随着众包竞赛的兴起,这会不会是金融市场的另一波创新浪潮?

三个臭皮匠,顶个诸葛亮?

让我们以kaggle为例,简要了解下众包竞赛的商业模式。以后我也会来写一篇文章专门来讲解众包。

公司

由公司提供平台它们需要解决的问题,然后社群通过竞赛的形式来帮助解决。虽然这看起来很美好,公司只要交一笔钱就能够获得解决方案。但这种方式同样面临着风险。

最大的风险就是提供的解决方案无法高效使用。以Kaggle为例,虽然有些解法能够提供非常高的精确度,但很多需要消耗完全不必要的计算资源,或是采用公司并不支持的语言或者操作方式。导致最终真正用来提升公司运作效率的解决方案寥寥无几。

另外的风险则是IP(Intellectual Property),如何保证解法为公司所有而不是被社群拿去到处甩卖。

因此,很多公司采取众包比赛的方式,不是为了获得解决方案,而是分享公司的工作内容,提升知名度,也作为招揽人才的重要渠道之一。

平台

众包竞赛的模式对平台而言最难的部分在定义问题。因为要把一个实际生活中面临的问题描述清楚,并为竞赛者提供需要的数据和支持,并不比解决问题简单。因此,很多时候,需要有着丰富知识的博士生或者专业的数据科学家来帮助定义问题,并搜集解决问题需要的数据。这些高质量人才对于平台来说是一个非常大的开支。

因此,众包竞赛的模式并不被看好。

对冲基金 + 众包

越来越多的基金公司开始依靠机器策略来进行交易,而在numerai之前,也有大量的对冲基金创业公司在尝试有效的结合群众的智慧来发展交易模型并应用在金融商品的交易中。因为一家基金公司可能会雇佣200-300名数据科学家来优化交易模型,但300人的智慧终究无法和10000甚至更多的数据科学家智慧相提并论。

这之中存疑的地方在,一个顶级交易员产生的策略究竟能否和普通数据科学家产生的策略相比较?

分析这个疑问的一个角度是有大量的数据科学家并不在金融领域工作,那么,这些其他领域的数据科学家能否比专业交易员有着更好的表现?另一方面,采用机器学习中的ensemble(ensemble可以简单理解为有很多模型在不同的方面表现的不错,那如果把它们结合起来并在它们擅长的情境下采用它的预测,就能够提升预测的准确度)或者统计中的random forest(用以平均模型带来的效果),能够有效的降低单一模型的错误率。在这里,三个臭皮匠有机会胜过一个诸葛亮

虽然这一切听起来都很美好,但采用众包的方式生成交易策略有着很严重的问题

策略跑路:

最惨的就是有了好的交易策略但是并不提供给平台,而是自行拿去交易了。

城堡集团Citadel LLC就是一个很好的例子。城堡集团采用的是multi-manager platform模式,公司会雇佣很多的投资组合经理,由他们自行招募自己的分析师和交易员,那表现良好的策略分得的管理资金规模更大,但这也导致公司的离职率很高。因为如果我的交易策略这么好,为什么不自己成立一家对冲基金公司单干,赚的钱也就更多。

同理,竞赛中产生的策略也有可能不被用来提交,而是自行拿去交易。

数据集透明

第二个问题则是大量数据集的暴露。因为要实现理论上最大的收益率,就要有足够多的数据源,才有可能得出最好的结果。

除此之外,为了进行回溯测试,在过去的历史数据上来测试模型的质量,也要有足够长时间跨度的数据。

为了获取大量的数据源和大跨度的历史数据,基金公司通常需要花费很高的价格在市场上进行购买,同时为了提升自我的竞争力,也需要花费很高的人力物力来自行收集制作。

如果为了一场比赛,就让自己花费很高代价的数据免费公开给大家做数据分析,而且跑出来的结果可能还会拿走跑路,赔了夫人又折兵。

Numerai

相较于它的前辈Quantopian,QuantConnect和Quantiacs,Numerai 创新的地方就在于,它通过一套自己的加密系统,很好的解决了”对冲基金+众包”面临的两个挑战。

Encryption

Numerai通过自己的一套加密算法,在保留数据特征的前提下,让使用者无法推知数据的来源。

Numerai Data set

正如官网展示的那样,用户看到的都是normalized(将数据转为0-1之间的数)后的数据集,当你看到feature1,你无法确定它是不是Nasdaq指数,或者是黄金的价格,你同样无法确定的是这是哪一天的交易数据。但你可以根据这样的数据进行建模,并且当你作出自己的预测时,numerai可以解密出真实的结果。

用户只需要下载数据集,自行建立模型并对历史数据进行拟合,之后将数据用于新的数据集,作出预测后,上传预测即可。

Numerai并没有提及它们所使用的加密技术究竟是什么,不过同态加密技术可以达到相同的效果。

加密技术带来的效果

用户并不了解数据集背后的信息,它们也不知道自己作出的预测究竟是针对什么的,因此,自己的模型离开了平台提供的数据就一文不值。这种对数据的模糊处理降低了参与壁垒,方便了其他行业数据科学家的参与。你不需要了解任何金融知识,只需要知道如何建立模型,如何对数据进行分析就足够了。

同样的,这也让平台离不开用户。因为用户的模型仅自己知道,用户仅上传模型作出的预测结果,而模型归自己所有,平台并不了解,也无法获取。离开了用户的模型,平台同样无法获利。

因为数据源并不被用户所感知。那么,numerai可以进入众多的金融市场,不论流动性高与低,只要能够带来最高的收益。它们需要做的就是为用户提供加密过的数据,策略就会在竞技比赛中,自动产生。

把预测的结果解密后,numerai就根据用户的预测历史,支付的押金(反映对自己结果的信心),来决定根据这项策略交易的资金量。因为每次比赛为期一周,在一周的前几天它会利用预测的结果来验证,并综合历史回测和最新的验证来决定真正用于交易的策略选择。当它在市场上获利后,再根据比例,把一部分获利返还给用户。

Staking

另一项小的改进则是staking,用抵押来表示自己对于预测结果的信心。因为如果零成本的去做预测,用户大可以随机组合出几百万种结果,只要蒙对一种就能够获得回报。因此,staking提升了用户的作恶成本,而且抵押金额大说明用户的信心足,这也让平台根据风险能够分配更多的资金在相对应的策略上。

区块链

采用numerai发行的代币NMR当然有利于numerai减少资金量的投入,加密货币用作支付保护了用户的隐私信息并且方便全球的用户参与比赛。但是,其他的加密货币也能够达到保护隐私,允许全球参与的效果。

资金募集

numerai作为一家对冲基金公司虽然在策略上有着很大的优势,但它同时也面临着资金募集的挑战。对冲基金公司一般不对外发售基金,仅对机构和一些满足资产要求和其他条件的个人开放。这种针对少数投资人的基金好处是方便管理,也便于保护自己的交易策略。因为高净值人群往往有着较高的学历,对冲的策略也更容易被他们所理解,这样,基金公司就对于投资标的的选择有着更高的自由度, 放开手脚干大事。

不过numerai则无法很好的解释自己的交易策略。因为模型归用户所有,而numerai并不了解模型采用的具体策略,只了解这个模型的预测能力非常强。这就是一个黑箱,虽然能力很强,但面对并不了解的内部结构,对未来也有更高的不确定性。因此,在资金募集方面可能会面临一些挑战。

评论