基于机器学习的证券大数据解决方案

大数据分析已经广泛应用于金融服务行业,帮助投资者实现更好的投资决策。在数据变化频繁、维度丰富、体量巨大的股票市场,投资者更加需要使用大数据的能力以获取稳定的超额收益。借用基于机器学习的证券大数据平台,投资者利用机器学习算法和算力支撑平台来挖掘有效的因子特征组合,生成投资策略模型

行业现状

Generic placeholder image

缺少支撑算力的平台

传统投研平台使用非大数据IT构架的平台来支撑分析,所以没有能力突破单位时间内数据分析的的瓶颈,在数据挖掘的深度和维度上无法达到一个新的高度

Generic placeholder image

无法批量大规模训练算法模型

传统投研平台受到软硬件环境的限制,同时缺乏算力平台支持,无法迅速扩展算法以及批量训练模型,导致研究人员无法进行大量、高效的模型训练和验证

Generic placeholder image

无法规模化回测算法模型

传统投研平台支持小规模或单体回测方法,但是无法允许研究人员采用大规模历史回测的手段来进行更加深度的策略研发

Generic placeholder image

缺乏自动化数据处理

传统投研平台分析过程中需要分析师手动处理数据的生命周期,平台无法提供从历史数据获取、实时数据采集、规模化数据模型训练,回测分析等一系列的自动化工具,同时也缺乏对数据安全、监控的高级管理

体系架构

金融数据接口
金融网站公告信息
企业存量金融数据

数据查询

可视化分析

回测工具

证券大数据平台

用户交互界面

数据查询
回测引擎
模型管理
数据采集
主题数据
模型
机器学习
深度学习
数据湖
数据治理
数据标签
训练数据

BDOS

资源管理

作业管理

资源调度

作业调度

性能检测

虚拟化资源

CPU

内存

存储

网络

安全

基础设施

服务器

储存

网络

安全设施

应用场景

交易策略研发

交易策略研发

给投研机构进行大数据赋能,让机构能高效地进行「因子挖掘」、「模型分析」、「策略研发」和「策略回测」,实现更高的超额收益率

风险管理研究

风险管理研究

基金投资者和管理者通常将风险管理放在重要的位置。证券大数据平台允许使用者利用海量的市场数据和内置的机器学习模型来度量风险程度,以及研究与不同投资组合价值之间的关联

证券金融学术研究

证券金融学术研究

金融学术研究对投研团队的交易策略制定具有非常重要的指导意义,学术团队在理论依据的基础之上,通过海量的市场数据构建模型来对宏观经济、市场指数、大盘进行规模化的分析和系统的学术研究

方案优势

一站式平台托管

提供一站式(私有化)发布平台,包含数据采集、清洗、转换、模型训练和回测一整套功能体系,辅助投研机构进行高效且持续的分析,支撑量化团队进行海量数据分析与建模

多维度数据模型训练

利用分布式计算能力,从不同数据源中提取数百个特征进行模型训练。而人类交易员通常在相同场景下只能使用5到8个技术指标,并需要大量重复手动劳动完成

优化策略能力

使用大数据分析能力探索历史数据,辅助投研机构制定超额收益策略,通过构建自动化数据流水线,完成增量数据到持续训练到模型持续优化的闭环

数据挖掘能力

使用机器学习算法,可以大幅度帮助分析师找到股票历史数据之间的关联,挖掘数据之间隐藏规律​

大规模并行模型训练

系统支持批量训练策略模型并进行回测,例如:从50个因子当中随机选取2个进行大规模批量模型训练,可以批量生成1225个模型训练,如果是3个则生成19600个模型训练,以此类推

数据资产管理

保证投研机构的数据资产在数据流水线的任何步骤中都不会丢失 ,内置的监控系统可以告知每个程序正在处理的数据量,平台的动态算力管理可以支持大规模(数据、模型训练)并行处理

接入流程

1

咨询方案

2

确定功能清单

3

测试部署集成环境

4

标准发布

5

应用设施