数据中台的行业应用场景
数据中台的理念和核心技术是通用的,但是其价值主要体现在具体行业业务的提升上,因此其应用场景与行业是紧密相关的。以数据中台在各个行业的应用场景和案例来阐述数据中台的适用场景,能够更好地回答“数据中台究竟能给我们带来什么价值”这个问题。
互联网行业
说到数据中台,首先想到的当然是互联网行业。过去几年中,凭借着移动互联网的红利,以阿里巴巴、腾讯为代表的互联网企业飞速发展,业务规模直线攀升,随之而来的是公司内部大量的重复建设和资源浪费。阿里巴巴先后上线了1688、淘宝、天猫、聚划算、闲鱼等业务,这些业务虽然针对的是不同的细分领域,但用到的订单、商品、库存、价格、仓储、物流等系统功能高度相似,如果每上一个新业务都要将这些系统功能全部重新开发一遍,无疑是很大的资源浪费。在这个大背景下,阿里巴巴内部不断提升共享服务部的职权,对各个业务部门重复使用、反复建设的系统功能进行统一规划和管理,从而拉开了阿里巴巴大刀阔斧改革的序幕。
阿里巴巴数据中台是从后台及业务中台将数据流入,完成海量数据的存储、计算、产品化包装的过程。在这个过程中,阿里巴巴逐渐形成了自己的核心数据能力,为前台基于数据的定制化创新和业务中台基于数据反馈的持续演进提供了强大支撑,这可以说是数据中台的核心价值之一。简单来说,数据中台就是对内提供数据基础建设和统一的数据服务,对外提供服务商家的数据产品。阿里巴巴数据中台的核心是OneData,OneData体系建立的集团数据公共层从设计、开发、部署和使用上保障了数据口径的规范和统一,实现了数据资产全链路的管理,提供了标准数据输出。统一数据标准是一项非常复杂的工作,因为同一个数据指标的定义众多。例如,对于UV这个数据指标,统一标准之前阿里巴巴内部竟然有十多种数据定义。据介绍,OneData数据公共层总共对30 000多个数据指标进行了口径的规范和统一,梳理后数据指标缩减为3000余个。从2015年至今,中台战略已经为阿里巴巴创造了巨大的价值。
连锁零售业
连锁零售业也是数据中台的典型应用场景。虽然连锁零售企业拥有的数据体量没有电商企业那么大,但它们对于数据驱动的需求同样强烈,而且这种需求也是典型的可以用数据中台来解决的需求。
以衣邦人为例,它首创式地将“互联网+上门量体+工业4.0”的C2M商业模式引入行业,成为迅速撬动服装定制蓝海市场的零售企业。截至2019年年底,衣邦人已拥有48个直营网点,服务范围辐射全国140多个城市,累计预约客户突破110万。衣邦人的成功,除了商业模式独特外,数据中台功不可没。
作为一个数据驱动的零售商,衣邦人在广告渠道管理、精准营销、个性化服务、门店管理等方面充分发挥数据的威力。例如,其数据中台打通了各个渠道的广告数据以及后台的CRM、ERP及业务系统数据,可以实时了解广告投放的真实成单效果,防止可能的广告欺诈,同时可以精准计算各个渠道的ROI,进而及时放弃无效渠道,增加高效渠道的投入。在客户服务层面,能够快速实现精准的用户画像,提供个性化的促销及产品推荐。在管理层面,为各个门店提供定制化的业务数据报表,赋能一线业务人员。
与传统的数据仓库、大数据平台建设的方式不同,衣邦人在建设数据中台的过程中坚持以业务为导向,在建立全局的数据模型、数据服务的过程中不断提供解决实际业务痛点的数据应用,从全渠道分析、用户画像触达到标签体系及服务,让数据中台的价值得以快速体现。
金融业
银行、证券、保险等金融行业也是数据中台的典型应用场景。以银行业为例,随着移动互联网的迅速发展,其业务呈现复杂化的局面,移动银行、手机银行所带来的复杂业务,使得银行必须通过数据中台来快速应对各类复杂的应用需求。银行业的数据中台建设需要在前台业务系统与后台数据系统之间构建一条数据和能力的通道,为前台的业务团队、客户经理、财富顾问与后台的数据专家、算法模型专家、人工智能专家的工作衔接提供强有力的支撑。业务团队专注于产品的具体逻辑与业务管理流程,数据专家专注于加速从数据到价值的过程,提高对业务的响应能力。
以富国银行为例,这家一度被称为“美国最佳零售银行”的私人银行,以创新和客户服务著称于世。早在1983年,富国银行就建立了自己的数据仓库系统。富国银行还是少有的将数据战略写入董事会战略的银行之一,其对数据战略的重视可见一斑。不过,像大部分银行一样,富国银行以前的数据平台都是围绕业务线建立的,每个业务部门都建设有自己的数据系统,这就导致富国银行虽然坐拥7000万客户的数据,但是这些数据分布在众多银行部门和系统中,难以复用和共享。而要解决这样的问题,数据中台是非常适合的。
基于对数据战略的深刻认识,富国银行于2017年启动了建立全行集中数据运营和洞见团队、建设新型数据平台的工作,主要工作包括企业数据治理、企业数据资产管理、企业数据管理、企业级数据集成、数据安全管理及数据授权。这些工作所要实现的功能其实与我们阐述的数据中台的功能大同小异。通过这样的变革,富国银行实现了数据战略升级。2019年7月,在全球前1000的银行排名中,富国银行高居第七位。
物联网
物联网(IoT)设备需要传输大量的传感器数据,对于数据处理提出了很高的要求,而数据中台正是解决这些问题的良方。以北京中信大厦IoT项目为例,中信大厦又名中国尊,地上108层、地下7层,可容纳1.2万人办公,总建筑面积43.7万平方米。为了进一步提升整个建筑的智能化水平,中国尊中部署了大量传感器以收集各种数据(温度、湿度、电声光等),它们会持续以很高的频率(一般时间间隔为1〜5秒)产生大量读数,并上传给物联网网关。这些数据是实现智能楼宇管理的基础,上层的智能监控、能耗分析等业务应用都依赖于这些数据的服务。现代大楼一般会有几百万到几千万个传感器,后台的数据处理系统必须具备相应的数据处理能力。
但是,物联网数据的处理有其特殊性:一是设备的多样性导致数据的多样性,必须通过物联网网关将其转换成标准格式;二是同样的数据需要用不同的时间粒度和形式来处理。例如,同样的能耗数据,必须以实时流数据的形式提供给实时报警系统和监控大屏,以关系型数据的形式提供给BI报表系统生成日报和周报,三个月到半年的数据需要以时数据的形式提供给智能监控分析程序进行机器学习,更长时段(比如两到三年)的数据需要以压缩的数据格式提供给历史数据分析程序。对于这种多样的需求,一般的数据平台处理起来通常会非常棘手,而通过数据中台,中信大厦将物联网网关数据纳入统一的采集框架,自动提供底层数据不同格式和粒度的管理和转换,在汇总后将基本数据通过统一的数据接口供上层应用使用,而且所有的应用和数据全部运行在同一个集群中,由统一界面进行管理,从而解决了多源异构数据的处理及可控管理的难题。
以上内容摘自《云原生数据中台:架构、方法论与实践》部分章节。
关于作者:彭锋,智领云科技联合创始人兼CEO。武汉大学计算机系本科及硕士,美国马里兰大学计算机专业博士,主要研究方向是流式半结构化数据的高性能查询引擎,在数据库顶级会议和期刊SIGMOD、ICDE、TODS上发表多篇开创性论文。2011年加入Twitter,任大数据平台主任工程师、公司架构师委员会大数据负责人,负责公司大数据平台及流水线的建设和管理。
宋文欣,智领云科技联合创始人兼CTO。武汉大学计算机系本科及硕士,美国纽约州立大学石溪分校计算机专业博士。曾先后就职于Ask.com和EA(电子艺界)。2016年回国联合创立智领云科技有限公司,组建智领云技术团队,开发了BDOS大数据平台操作系统。
孙浩峰,智领云科技市场总监。前CSDN内容运营副总编,关注云计算、大数据、人工智能、区块链等技术领域,对云计算、网络技术、网络存储有深刻认识。拥有丰富的媒体从业经验和专业的网络安全技术功底,具有超过15年的企业级IT市场传播、推广、宣传和写作经验,撰写过多篇在业界具有一定影响力的文章。
留言
评论
${{item['author_name']}} 回复 ${{idToContentMap[item.parent] !== undefined ? idToContentMap[item.parent]['author_name'] : ''}}说 · ${{item.date.slice(0, 10)}} 回复
暂时还没有一条评论.