北京理财网平台

自动生成投研报告靠谱吗?AI 如何辅助量化交易?

宽拓科技2021-02-16 07:16:11

#人工智能与金融结合的思考#


关于人工智能如何结合金融的话题,今天的推文来做一次全面的透视如何?


目前金融机构的主流玩法有四种:1. 投资银行和卖方研究尝试自动报告生成,2. 金融智能搜索;3. 公募、私募基金在通过人工智能辅助量化交易;4. 财富管理公司在探索智能投顾方向。


由于篇幅较长,文章或许有些专业,但保证不无聊。Enjoy~



1
自动生成投研报告靠谱吗?



在投资银行的投行业务与证券研究业务中涉及大量的固定格式的报告撰写工作,如招股说明书中的部分章节,研报,以及投资意向书。这些报告撰写需要大量的投行初级员工进行长时间枯燥繁琐的数据罗列、整理、反复Copy-Paste 工作。


目前,自动报告生成主要运用自然语言处理(NLP)中的两种技术:


自然语言理解(NLU):将日常话语消化理解,并转化为机器可后续处理的结构;

自然语言生成(NLG):将由机器拆分好的结构化数据以人们能看懂的自然语句表达出来。


我们可以将这两种技术理解看成对日常对话这一原料的拆分加工和整装成可理解的自然语句——最终产品。


然而真正生成报告还需要利用以上技术完成3个步骤:


1.处理海量异构数据



将投行分析师需要阅读的年报,彭博新闻社的实时新闻以及数据,行业分析报告,以及法律公告等资源进行消化。其中对于文本中的图片和表格需要OCR(光学字符识别)等技术解析。


2.分析数据


这一过程涉及运用知识图谱中常用的知识提取与实体关联将其关键逻辑主干抽出,结合事件地点等因素,将关键信息嵌入预先设计好的报告模板中。


3.文章生成



经过处理海量异构数据与分析数据的过程后,即可生产新闻,券商分析研报,上市招股书,企业年报,定增公告,甚至基金研究员每日开晨会所需的投资建议书也都可以用类似方式生成。


用户只需选择符合其需求的模板确定主题与关键信息,以及报告呈现形式,便可生成基本内容。而且投行分析师可以进行校对与人工二次编辑,加入有价值的观点与结论,并提升报告精准度。


自动报告生成已经被广泛的运用到新闻行业中,代表的科技公司有美联社投资的 Automated Insights 已为美联社自动生成出 10 多亿篇文章与报告。法国公司 Yseop 可以每秒生产 3000 页内容,支持英语,法语,德语等多种语言,产品广泛用于银行、电信公司的客户服务部门以及财经新闻网站。



但是一些科技公司已经不仅仅满足于为新闻行业提供自动报告生成的服务。


Narrative Science 由西北大学的新闻系和计算机科学系的联合创立,旨在通过给定主题的数据分析,自动生成文章报告。


该公司的著名数据分析平台 Quill 可以分析结构化数据,将人工智能与大数据进行技术融合,理解这些数据的重要性,从而产生简短的文字表述或结构化的报告内容。Quill 的主要面向对象为——金融服务提供商。


Narrative Science 的 CEO Frankel 表示“我们的目标是替代人工做绝大部分基础工作,让机器来处理数据和信息”。



2
人工智能如何辅助量化交易



量化交易从很早开始就运用机器进行辅助工作,分析师通过编写简单函数,设计一些指标,观察数据分布,而这些仅仅把机器当做一个运算器来使用。直到近些年机器学习的崛起,数据可以快速海量地进行分析、拟合、预测,人们逐渐把人工智能与量化交易联系得愈发紧密,甚至可以说人工智能的 3 个子领域(机器学习,自然语言处理,知识图谱)贯穿量化交易的始终。


1. 机器学习:从数字推测模型



量化交易分析师们对财务、交易数据进行建模,分析其中显著特征,利用回归分析等传统机器学习算法预测交易策略。


这种方式有两个主要弊端,其一是数据不够丰富,仅限于交易数据,更重要的是它受限于特征的选取与组合(Feature Engineering),模型的好坏取决于分析员对数据的敏感程度。此外一种做法是,模仿专家的行为,选择某一领域的特定专家,复制他们的决策过程,并导入可重复的计算框架。


全球最大的对冲基金桥水联合(Bridgewater Asspcoates) 早在 2013 年就开启一个新的人工智能团队,该团队约有六名员工,由曾经供职 IBM 并开发了认知计算系统 Watson 的 David Ferrucci 领导。


据彭博新闻社报道,该团队将设计交易算法,通过历史数据和统计概率预测未来。该程序将随着市场变化而变化,不断适应新的信息,而不是遵循静态指令。而桥水基金的创始人也曾公开表示,其旗下基金持有大量多仓和空仓,投资 120 种市场,持仓组合高达 100 多种,并且以人工智能的方式考虑投资组合。



Rebellion Research 是一家运用机器学习进行全球权益投资的量化资产管理公司,Rebellion Research 在 2007 年推出了第一个纯人工智能(AI)投资基金。


该公司的交易系统是基于贝叶斯机器学习,结合预测算法,响应新的信息和历史经验从而不断演化,利用人工智能预测股票的波动及其相互关系来创建一个平衡的投资组合风险和预期回报,利用机器的严谨超越人类情感的陷阱,有效地通过自学习完成全球 44 个国家在股票、债券、大宗商品和外汇上的交易。


伦敦的对冲基金机构 Castilium 由金融领域大佬与计算机科学家一同创建,包括前德意志银行衍生品专家、花旗集团前董事长兼首席执行官和麻省理工的教授。


他们采访了大量交易员和基金经理,复制分析师、交易员和风险经理们的推理和决策过程,并将它们纳入算法中。



在量化交易方面的人工智能初创公司有日本的 Alpaca,旗下的交易平台Capitalico 利用基于图像识别的深度学习技术,允许用户很容易地从存档里找到外汇交易图表并帮忙做好分析,这样一来,普通人就能知道明星交易员是如何做交易的,从他们的经验中学习并作出更准确的交易


同时Alpaca 也推出 AlpacaScan 作为对美国股票市场实时反映的的K线图工具,抛弃二进制滤波的局限旨在提供给交易员用来识别潜在市场变化趋势的日常必需工具。


坐落在香港的 Aidyia 致力于用人工智能分析美股市场,依赖于多种AI的混合,包括遗传算法 (genetic evolution),概率逻辑 (probabilistic logic),系统会分析大盘行情以及宏观经济数据,之后会做出自己的市场预测,并对最好的行动进行表决。与其类似的公司还有Point72 Asset,Renaissance Technologies,Two Sigma。


2. 自然语言处理:把握市场动态



当量化交易分析师发现数字推测模型的局限性后,开始考虑引入新闻,政策,社交网络中的丰富文本并运用自然语言处理技术分析,将非结构化数据结构化处理,并从中探寻影响市场变动的线索。


率先使用自然语言处理技术的人工智能对冲基金的是今年6月份在伦敦新设的对冲基金 CommEq。CommEq 的投资方法结合了定量模型与自然语言处理(NLP),使计算机能够如人类一样通过推断和逻辑演绎理解不完整和非结构化的信息。


除此之外,也有采用自然语言处理技术的金融科技公司,如由李嘉诚与塔塔通讯投资的 Sentient Technologies 运用自然语言处理,深度学习(Deep Learning)等多种AI技术,进行量化交易模型的建立。




其中最为知名的是号称”取代投行分析师“的投资机器人——Kensho。


Kensho 是一家致力于量化投资大众化的人工智能公司,旗下有一款产品Warren 被称之为金融投资领域的“问答助手Siri”。Kensho 结合自然语言搜索,图形化用户界面和云计算,将发生事件关联金融市场,提供研究辅助,智能回答复杂金融投资问题,从而加速交易时间,减少成本,用动态数据与实时信息,及时反映市场动态。


这一技术也被广泛运用于风控与征信。通过爬取个人及企业在其主页、社交媒体等地方的数据,一来可以判断企业或其产品在社会中的影响力,比如观测 App下载量,微博中提及产品的次数,在知乎上对其产品的评价;


此外将数据结构化后,也可推测投资的风险点。这方面国内的很多互联网贷款,征信公司都在大量使用自然语言处理技术,例如宜信,闪银等。另外一些公司则利用这些技术进行 B 端潜在客户的搜寻,如 Everstring,并将信息出售给其上游公司。


3. 知识图谱:减少黑天鹅事件对预测的干扰


机器学习与自然语言处理的技术经常会在一些意外(如“黑天鹅”事件)发生的时候预测失败,例如 911、熔断机制和卖空禁令等等。人工智能系统没有遇到过这些情况,无法从历史数据中学习到相关模式。这时候如果让人工智能管理资产,就会有很大的风险。


此外,机器学习擅长发现数据间的相关性而非因果性。


很有名的一个例子是早在 1990 年,对冲基金 First Quadrant 发现孟加拉国生产的黄油,加上美国生产的奶酪以及孟加拉国羊的数量与标准普尔 500 指数自1983 年开始的 10 年时间内均具有 99% 以上的统计相关性,1993 年之后,这种关系莫名其妙的消失了。


这就是由于自学习的机器无法区分虚假的相关性所导致的,这时候就需要专家设置的知识库(规则)来避免这种虚假相关性的发生。


知识图谱本质上是语义网络,是一种基于图的数据结构,根据专家设计的规则与不同种类的实体连接所组成的关系网络。


知识图谱提供了从“关系”的角度去分析问题的能力。就金融领域来说,规则可以是专家对行业的理解,投资的逻辑,风控的把握,关系可以是企业的上下游、合作、竞争对手、子母公司、投资、对标等关系,可以是高管与企业间的任职等关系,也可以是行业间的逻辑关系,实体则是投资机构、投资人、企业等等,把他们知识图谱表示出来,从而进行更深入的知识推理。


目前知识图谱在金融中的应用大多在于风控征信,基于大数据的风控需要把不同来源的数据(结构化,非结构)整合到一起,它可以检测数据当中的不一致性,举例来说,借款人张三和借款人李四填写的是同一个公司电话,但张三填写的公司和李四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。




最早应用知识图谱在金融领域的 Garlik 就是这一代表。这家公司 2005 年成立于英国,核心成员来自南安普顿大学(University of Southampton,是语义网的核心研究机构之一),主要业务是在线个人信息监控。


Garlik 收集网络和社交媒体上的个人信息,当发生个人信息盗窃时会及时报警。Garlik 总计融资2469千万美金后被美国的三大个人信用记录公司之一Experian 收购,其技术被用于个人信用记录、信用盗窃的分析。Garlik 的核心技术之一是大规模语义数据库,前后开源发布了 3store, 4store, 5store等高性能数据库。


除此之外还有 Dataminr,这家基于 Twitter 及其他公开信息的实时风险情报分析公司。


致力于从数据爆炸的社交网络提取精简且价值的风险情报与挖掘关键信息,如舆情热点、金融相关的非交易信息、公共机构安全预警、企业安全等,并直接向客户推送。除此之外,Dataminr 还加入早期预警系统,并实时推送警报


而以投资关系为例,知识图谱可以将整个股权沿革串起来,方便地展示出哪些PE机构在哪一年进入,进入的价格是多少,是否有对赌条款,这些信息不仅可以判断该机构进入当时的估值,公司未来的发展情况(公司成长的节奏),还可以看清PE机构的投资偏好,投资逻辑是如何变更发展的。


目前知识图谱在工业界还没有形成大规模的应用。即便有部分企业试图往这个方向发展,但很多仍处于调研阶段。


我们认为这其中的难点在于如何与特定领域机构建立起一套合作方式,如何将合作变成一种可轻易编程的界面,让领域专家可以通过系统以一种非常简单的方式进行行业逻辑的建模,而他的逻辑可以通过系统实时得到验证,使其进一步更新,只有通过专家与机器反反复复的迭代,形成闭环,才会服务好用户。



全球估值第四高,被称为“下一个独角兽”的公司——Palantir 曾推出一个基于知识图谱的金融数据分析平台—Palantir Metropolis,可以整合多源的量化资料,并提供一套方便易用的分析工具来满足复杂的研究需求,其中的组件能够进行复杂搜索,可视化编辑与分析,有非常丰富的人机交互能力。


目前 Palantir 结构化客户内部数据,关联相关数据,让客户自己创立分析规则整合并优化模型,量化处理数据,从而解决客户的特定需求。



3
金融搜索引擎



券商/私募基金研究员在进行研究工作的时候需要搜集海量信息,再整理和分析其中内容,如上下游分析,对标企业研究,竞争对手研究,企业亮点/风险点分析等等。


然而目前绝大多数证券分析师所运用的辅助研究软件如 Bloomberg 数据终端只解决了基础数据问题,而没要考虑到信息量过载的问题。这使得研究员在面对大量基础数据与爆炸的信息时无法寻找到最有准确有价值的信息,也无从提高其工作效率。


金融搜索引擎的背后核心技术是高质量的知识图谱和大量的业务规则,帮助实现联想、属性查找、短程关系发现。探索引擎,如分面浏览器,也是在知识图谱的基础上,则提供了人机协作的界面,让人对数据的探索过程可以很方便地被记录、迭代、重用。此外推荐系统和推送系统也非常有用,帮助金融用户聚焦在关键数据上,更省时省力地做投前发现和投后跟踪。


其中语义搜索就是提供不同类型的查询(比如企业、基金、事件等),如智利地震对铜期货的影响,中东危机对整体货币市场的影响等。再将信息切片后再聚合,提供纵览的可视化元素,比如影视传媒相关定增的平均市值和融资市盈率。


语义搜索将复杂查询交给用户完成,如寻找VR的上游企业,当搜索提供不了准确上游的信息时,会推荐摄像头的企业给用户,并提供一个方便的交互界面,交给用户去进行一些复杂的过滤。




Alphasense就是这样一个在数据层面上轻量级,将复杂逻辑判断交给用户去完成,专注于解决专业信息获取和碎片问题的金融搜索引擎。


Alphasense面向金融投资领域,从文件/新闻和研究中集合所有投资信息并进行语义分析,在全球公司数据中进行趋势分析。其使命愿景是从大量噪音中寻找有价值的信息,专注信息丰富度和碎片化基本问题,从而大大提高金融人士的工作效率,节省工作时间。



4
智能投资顾问



传统投资顾问需要站在投资者的角度,帮助投资者进行符合其风险偏好特征、适应某一特定时期市场表现的投资组合管理。而这些工作都需要以大量昂贵的人工方式完成,所以财富管理服务也因此无形的提高了进入门槛,只面向高净值人士开设。


但是现在,智能投资顾问(robot advisor)正在以最少人工干涉的方式进行投资组合管理,管理你的资产的可以是一排计算机,而你也不用是高净值人士。并且智能投顾在以更强大的计算机模型运用人工智能的技术对大量客户进行财富画像,以人工智能算法为每一位客户提供量身定制的资产管理投资方案。


Wealthfront 就是一家非常具有代表性的智能投顾平台,借助于机器与量化技术,为经过调查问卷评估的客户提供量身定制的资产投资组合建议,包括股票配置、股票期权操作、债权配置、地产资产配置,旨在提供一个自动化的投资管理服务最大化投资回报。



Wealthfront在进行自动化投资管理时一共有5个步骤:


确定当前投资环境的理想资产类别

以最低成本的ETF(交易型开放式指数基金)代表每一资产类别

确定风险承受能力并创建合适的投资组合

将现代投资组合理论(MPT)分散风险

定期监控并重新调整平衡投资组合


而这一投资方法也受到市场的肯定,Wealthfront管理资金规模在2015年至2016年终增长将近64%,截至2016年2月底,Wealthfront的资产管理规模已达近30亿美元。


在获得市场肯定的背后,是对智能投顾的信心。智能投顾能够战胜人性,避免投资人受市场变化而产生不理性的情绪化影响,使机器严格执行事先设定好的策略。并且智能投顾拥有比传统财富管理机构、私人银行更为透明开放的信息披露,及时提供风险提示,极大的减少了资产托管人与管理人之间的信息沟通壁垒。



Betterment也是一家专注于智能投资管理的金融科技公司,通过Markowitz 资产组合理论和各种金融衍生模型们应用到产品中,在云端低成本、快速、批量化地解决各种数据运算,再根据用户的倾向和设定的风险偏好,个性化地提供资产配置组合方案。


其创始人Jon Stein曾在华尔街某金融机构任职高级投资顾问,致力于打造Betterment成为一款让投资更方便,更准确的智能投顾。2016年3月,Betterment获得E轮融资1亿美金。




而由两名微软前员工创立的FutureAdvisor是一家专注于养老金理财市场的智能投顾公司。


 FutureAdvisor为面对有很多不同的财务账目,退休金,储蓄,股票,甚至一些CDs或债券但却不知道如何做出正确的选择的客户服务。 FutureAdvisor利用智能算法实时监测理财账户,寻找节税机会并调整多个账户。除了提供免费的投资组合优化以及投资数据的同源整合, FutureAdvisor也提供收费版投资代理服务。目前 FutureAdvisor以2亿美元估值被全球最大基金管理公司BlackRock收购。


(schwab intelligent portfolios投资组合收益图)


在面对变化莫测的金融市场时,Charles Schwab(嘉信理财)旗下推出的智能投顾产品schwab intelligent portfolios则能以蒙特卡洛模拟动态市场上的投资组合表现进行投后跟踪。


同时在投资组合亏损的同时,机器会自动进行税收亏损收割,即将卖出亏损的证券递减一部分资本利得税。而当投资组合偏离预先设定的风险容忍度与资产配置建构时,机器会自动通过一系列买进与卖出的行为进行资产平衡的调整


智能投顾使人工智能技术不再远离人群,真正使得每一位普通人都能享受到智能金融科技公司所带来的好处,也让许多曾经认为“人工智能是遥不可及”的人认识到智能金融公司不仅仅只服务于金融行业的专业人士,而是可以为整个商业社会相关的群众创造价值。


当人工智能不再是新鲜事的时候,投资银行与证券研究自动生成报告、人工智能辅助量化交易、金融搜索引擎证券研究和智能投资顾问财富管理这四种人工智能和金融结合的主流玩法让我们看到在未来,金融和人工智能结合成为智能金融的无限可能。


而智能金融正在以一种人机结合的方式去提供大量的辅助决策工具,让投资人在形成逻辑链条的过程中,更容易地获得数据和分析层面的支持,才能以更多的精力去发现机器不善于完成的工作,从而大大提高工作效率。


<