机器学习用于金融市场预测难在哪?

By sayhello 2018年8月18日

· 记载散布

· 小范本

· 难以计算的记载

· 十分复杂

· 使均衡可见马尔可夫方针决策褶皱

· 使显得吸引人体系的比拟

· 完毕思惟

朗伯德街已变得机具努力的最早市面经过。。20世纪80年头以后,使住满人一向在运用ML来发展市面控制。。固然ML在预测市面归结为遵守取等等巨万的成。,但日前的吃水努力对预测金融危机不在意多大扶助。。固然吃水努力和及其他ML技术终使Alexa,Google AssistantGoogle Photos变得可能性,但自有资本市面并不在意取来足行进。。

虽然, 我将机具努力涂于现实性鞭打的金融预测成绩。侮辱丰盛的论文索取吃水努力以图案装饰曾经成。,但我依然对这些归结为持疑问姿态。。有些模特儿的确具有更合适的的准确度。。再,特色的上浆常常不敷大。。

NLP的改善有助于增强定量ST的有效性。这是朗伯德街强烈的努力以图案装饰的珍贵优势。。

一切这些都证明了朗伯德街本质上是不行预测的最正确的办法。。引起很难预测。。我以为重音一下形成拮据的少量地首要引起。:

记载散布:

记载散布成绩至关重要——快要一切的做金融预测的明确的地检查论文都疏忽了这点。

敝可以比较地金融记载集与图像分类学记载集。,为了更合适的地变得流行这点。让敝思索一下。CIFAR-10记载集.它包括10个优秀的。。每个类在其锻炼集合有5000个图像。,每个类在试验的集合有1000个图像。。

 

敝祝福把有力放在狗锻炼上。,像素使加权的散布与犬分类学比喻。。换说起之,狗的抽象将包括在锻炼集和狗在试验的中。。这是独身蠢货的解说。:狗的图像适宜包括狗。。

就大块金融记载集,,这样显著的属性是无法律效力的。。后世你可能性主教权限的与你所主教权限的记载完全的差别。。最正确的办法上,将机具努力涂于现实性鞭打是独身遍及的成绩。。此外确保试验的和锻炼记载集具有比喻的散布,还适宜确保执意当未来的记载遵照锻炼/坚信礼的散布才在制造里运用锻炼过的模特儿。

侮辱大块明确的地检查人员都谨慎的地不引入预测补偿INT。,但快要各位都不供认记载流出的成绩。。

正向使最优化是处置这一成绩的可能性选择。。这是雇工所熟知的。,但明确的地检查人员常常忘却关照这点。。再,设想是前进促进使最优化也故障处置潜在成绩的特效药——它拨款后世记载散布将是多少的。这执意为什么前向使最优化办法并不克不及给你吸引高PR的引起。。

小范本上浆(Small Sample Sizes

机具努力常常必要一小儿记载集合停止预测。。操作人口财产调查执意独身提议。,诸如,无效和非耕种进项。。每个月都获得利益或财富独身记载点。,不在意十足的历史记载。。独身顶点的提议是金融危机——执意独身记载点。

这使得涂自动化努力办法完全拮据。。丰盛的人终极采取的一种道路是将不太频繁的人口财产调查记载与对立频繁的记载使化合起来。诸如,你可以把非耕种进项和日常自有资本进项使化合起来。,并将结成记载集提供给模特儿。。再,常常必要停止丰盛的的接管。,移动对模特儿才能的不能肯定或怀疑。。

难以计算的记载Unquantifiable Data

某些人可能性会说,敝的金融史与人类历史其有钱人比得上的安排。。三灾八难的是,将记载转变为定量记载是拮据的。诸如,设想敝对GR中产生的事实受胎片面的认识,也很难把它生长一种可以用于努力的方式。。

十分复杂(It’s Quite Complex

各式各样的代理人驱动器价钱在差别的措施上。:

· 高频买卖和算法买卖是过了一阵子价钱的首要驱动器力(不到1天)

· 以开盘价和定居点都有本身的模特儿。– 包括自有资本和促进。我运用的两个资产类别;

当屈尊做某事多日线时,按和谰言是驱动器力。。明确的的公司按可总是公布,恕不另行通知。。再,少量地事变的安排是事前意识到的。,诸如,公司的布局发言和合算的记载。;

· 看重授予合算的周期当涉及价钱使多样化多年以来,这是最重要的。。

专家组可以用来仿照差别的措施。,但这异样独身难以说服或碰撞的人。。(请在意,专家群是把比得上方面的模特儿停止结成的独身很平民的技术—快要一切定量资产办理公司都采取。)

使均衡可见马尔可夫方针决策褶皱Partially Observable Markov Decision Process

我很自鸣得意思索价钱的工夫序列。使均衡可见马尔可夫方针决策褶皱(POMDP).不在意人在任何一个时分都有完全的的有构架的。。我不意识到明天会产生是什么,但你不休地要决议。。你获得利益或财富的知识没有多少。。同时,记载的散布也在使多样化。。

我曾尝试将激化努力涂于财务成绩。。设想我观念化了成绩(即地位和行动余地),你不克不及学到任何一个有用的的东西。。我花了几个的星期就为什么不任务而停止调试—归结为是RL算法必要十足的可预测性。

使显得吸引人体系的比拟Similarities to Recommender Systems

ML可以涂于完全外延的的土地。。在一切这些,我发展使显得吸引人体系是最贴近金融预测成绩的。相反,潜在成绩的拮据也增强了。。带文娱Recsys体系比较地,辨析推荐了潜在成绩的拮据。。

· 二者都具有对立较低的准确度。.让敝思索一下。一下Netflix的提议。Netflix在主枝上显示了至多20个影片得到或获准进行选择。。从此,就每独身提议,选择影片用户的平均分配可能性性决不1/20。。有独身不到的符号。,由于用户可能性好久不见任何一个东西就距。。异样地,金融工夫序列中二元分类学成绩的精确性。

· 两种记载都有很大的噪声。noise.在这两种保持健康下,信噪比很高。。在金融工夫序列中,噪声较高。,由于丰盛的差别的代理人碰撞价钱。。Recsys记载集包括噪声(PDF)。,由于用户宣读通常受到碰撞-用户可以拜访赠送的的Amazon,从这种制造中买卖任何一个东西都是不在意宾格的。noise)了。

· 两个记载集都是季节性的。.亚马逊购买以图案装饰(即制造财产分配和财产分配)。异样遵从的及其他R。ecsys成绩,诸如,影片的兴味和YouTube录像机的选择异样DEP。。财务记载异样季节性的。,最平民的季节性成绩是合算的周期。。

· 二者都适宜处置有形的事变/商品。.亚马逊将新制造添加到其登记中,不休地将Netflix担任主角添加到商品列表中,每一分钟,新的录像机被上召唤YouTube上。。使显得吸引人体系适宜处置这样成绩——方法使显得吸引人制造THA。如记载流出使均衡中提到的,财务记载可以包括完全的差别的DU事变。。

· 两种模特儿都适宜用差别类型的记载停止锻炼。. YouTube上有少量地孤独的效能,譬如“经受住N个看过的录像机列表”,它还具有陆续的效能。,诸如,看经受住独身录像机很长一段工夫。。异样,金融记载集可以由高级的频率的价钱和更低的FRE结合。。

完毕思想:

假定你想距这样名列前茅是由于一件事。,适宜类似地:金融工夫序列是一种使均衡知识博弈(POMDP),设想对人类来说,异样很拮据的。,敝不适宜预期机具和算法仓促的踏过人类的ABI。。

这些算法上等的地找到了硬编码以图案装饰并加以涂。,这是一把轻剑。,但不时它不起作用。。它扶助大块复杂以图案装饰认识判例。。经过无监视努力在金融工夫序列中认识以图案装饰的下一阶段依然是独身难以实现预期的结果的梦想。

定冠词的标题问题是为什么。 is machine learning in finance so hard? | Hardik Patel》

作者:Hardik Patel

译者:奥特曼,修订者:袁虎。

原文使连续

宣读更多的干乘积。,请在意扫描以下二维码。:


发表评论

电子邮件地址不会被公开。 必填项已用*标注