年终盘点丨2020大数据大事记

by June 2021-01-01

2020年一场疫情,使得各行各业都面临了一场不小的挑战与冲击,挑战中伴随着机遇,随着疫情好转,以大数据、5G、云计算等新兴技术为代表的新基建加速,大数据作为背后的关键技术更备受瞩目。时间如白驹过隙,转眼2020已经过去。在这一年里,大数据领域发生了些什么?又有什么大数据技术变得火热?让我们一起来回顾一下2020的大数据的大事件吧!

Facebook超大型数据中心,已全部采取可再生能源技术

众所周知,美国社交媒体巨头Facebook在丹麦建设超大型数据中心,目前Facebook的超大型数据中心的建立竟然造成本地温度上升,对于丹麦欧塞登的寒冷天气,也渐渐地增加了一丝温暖。

根据丹麦的能源局高官说:正是因为Facebook的超大型数据中心的建立使得温度的上升,给我们丹麦增加了一丝温暖,当然更多的是Facebook超大型数据中心是采取完全可再生能源建立的,对于我们采取可再生能源的计划更进了一步。

丹麦计划在2030年之后决定取消煤炭这种不可燃烧的资源。Facebook超大型数据中心一直在践行这个目标,包括用炭量减少了25%,这位高官对于Facebook的超大型数据中心表示祝贺。

迄今为止最大规模,Google 推出针对少样本学习的 Meta 数据集

深度学习的成功往往依赖于大量手动标注的训练数据,这种局限性,激发了对少样本学习的研究,Google 在 ICLR2020 发布的 Meta-Dataset 则针对此问题,进行了新的探索和尝试。这是一个用于少样本(Few-Shot)学习研究的资料,在这个人信息料集中,Google提出了一个大规模且多样化的基准,可用于测量不同图像分类模型的能力,并提供一个用来研究少样本学习的框架。

Google提到,虽然最近深度学习在一些难题上,都取得了重要的进展,但是这些成功的应用,通常来自于大量需要手动注解的训练资料,因此这也显示出了少样本学习的研究价值,从科学的角度来看,深度学习算法从有限样本中学习的能力,与人类相比的确存在明显的差距,而另一方面,从实际应用的角度来看,少样本学习也是一个很重要的课题,可让模型解决缺乏大型标签资料集的问题,使机器学习应用更加普遍。

推特遭遇史上最严重黑客入侵 多名政要账户信息遭泄露

7月,推特遭遇史上最严重黑客入侵。美国多名政要及名人的推特账户信息遭泄露。包括前总统贝拉克·侯赛因·奥巴马、亚马逊首席执行官杰夫·贝佐斯、特斯拉首席执行官埃隆·马斯克、微软联合创始人比尔·盖茨及苹果公司、优步公司等。黑客共劫持了130个账户,下载了其中8个账户的数据档案,包括账户所有者的电话号码和定位信息等。

对此,推特向开发者警示:私有应用密钥和账号令牌有暴露风险。Twitter表示,目前还没有看到任何证据表明这些密钥被泄露,但出于谨慎的考虑,还是提醒了开发者。邮件中说,可能使用过共享电脑的用户应该重新生成他们的应用密钥和令牌。目前还不知道有多少开发者受到该漏洞的影响,也不知道该漏洞具体何时被修复。Twitter发言人不愿意提供这方面的信息。

IBM 发布《2020年数据泄露成本报告》

2020年 7月,IBM Security 发布《2020年数据泄露成本报告》,宣布其全球调研结果。该项调研研究了数据泄露的财务影响,揭示了数据泄露事件给企业造成的平均成本为 386万美元,而其中员工账户遭受攻击是最昂贵的原因。对全球 500多个组织数据泄露事件的深入分析发现,有 80% 的事件导致了客户个人身份信息 (PII,Personally Identifiable Information) 暴露。在因数据泄露而暴露的所有数据类型中,客户 PII 也是造成企业耗费成本最高的一项。

企业越来越多地通过新的远程工作模式、基于云的业务运营模式来访问敏感数据,为此,该报告还阐明了这些数据遭受泄露后组织可能遭受的财务损失。IBM 的另一项调研发现,尽管这种工作方式转变已经引起了风险模型的变化,但超过半数的因新冠疫情而开始居家办公的员工并未获得有关如何处理客户 PII 的新准则。

大数据公司Palantir上市 市值高达209亿美元

9月30日,这家大数据明星公司正式上市,首日其股价盘中一度涨超57%,收涨31%。10月22日,Palantir收涨5.16%,报9.68美元。

这家公司成立于2003年,最擅长的是搜集大数据进行分析、监控等,拥有包括美国国防部、美国证券交易委员会、跨国集团等一系列高端客户。成立十七年以来,其最出名的案例就是成功找出了东躲西藏十几年的本·拉登、以及帮助多家大型银行追回了纳斯达克前主席麦道夫藏起来的数十亿美元巨款。

与此同时,随着几个新冠候选疫苗的临床试验进入最后冲刺阶段,Palantir的加入意味着一旦有疫苗获批,卫生部门能够有效地推进疫苗分发和追踪。目前,海外疫苗研发中,阿斯利康/牛津大学、BioNTech/辉瑞、Moderna、强生速度领先。辉瑞10月中旬发布公告称,公司计划在11月底与德国合作伙伴BioNTech一同提供新冠疫苗实验数据,以此向FDA申请疫苗紧急使用授权。

2020年云栖大会,云原生升级为阿里技术战略

2020 云栖大会,阿里巴巴宣布正式成立云原生技术委员会,云原生升级为阿里技术新战略, 并推出包括软硬结合的沙箱容器 2.0、 离线实时一体化数据仓库 MaxCompute、云原生多模数据库 Lindorm 在内的多款云原生产品。委员会将大力推动阿里经济体全面云原生化,并沉淀阿里巴巴 10 多年的云原生实践,对外赋能数百万家企业进行云原生改造,进一步帮助客户迈入数字原生时代。

同时,阿里巴巴在本次云栖大会发布多款重磅产品与技术,将部分重点发布总结如下:阿里云下一代大数据架构——湖仓一体;阿里云云原生分布式数据库 PolarDB-X 以及其两大全新企业级功能:混合负载 HTAP 和全局二级索引透明分布式。

再创新高,“黑五网一”亚马逊卖家销售额破48亿美金

11月末,2020年热火朝天的跨境电商促销活动黑色星期五、网购星期一落下帷幕。据Adobe Analytics的数据,“黑色星期五”的在线销售额同比激增21.6%,达到90亿美元,创历史同期新高。

黑五网一亚马逊卖家销售额破48亿美金再创新高。亚马逊全球开店公布官方数据,2020年亚马逊“黑五网一”期间,全球以中小企业为主的第三方卖家销售额超48亿美元,同比去年增长60%,包含中国卖家在内的全球中小企业中逾71,000家销售额超过10万美元。据Adobe Analytics的数据,美国感恩节的在线消费者支出同比增长了近22%,达到51亿美元,创下新的纪录。

2020大数据产业生态大会盛大召开

8月27日,2020(第五届)大数据产业生态大会在京隆重召开,中国工程院院士倪光南,中国科学院院士、大数据产业生态联盟主任委员梅宏,工业和信息化部信息技术发展司副司长杨宇燕,中国电子信息产业发展研究院党委书记宋显珠,以及来自各地方政府的大数据委办局主管领导、赛迪研究院专家、知名高校和科研机构的专家、大数据企业领袖共数百人出席大会。

在此次大会上,大数据产业生态联盟联合《软件和集成电路》杂志社、赛迪顾问股份有限公司、工信部赛迪智库共同揭晓了“2020中国大数据企业50强”,作为企业级大数据平台解决方案提供商,智领云科技凭借领先的技术优势与丰富的方案落地经验,在近2000家参评企业中脱颖而出,获评“中国大数据企业50强”。

自2016年以来,大数据产业生态联盟连续5年面向市场公开发布白皮书,旨在以数据为驱动,帮助传统产业顺利完成转型升级。《2020中国大数据产业发展白皮书》调研工作自2020年5月正式启动,历经近4个月的调研工作覆盖了2000余家大数据企业,回收有效调研问卷近千份,累积完成百余份大数据企业个案深度调研样本。

后台回复“2020白皮书”,获得《2020中国大数据产业发展白皮书》

2020年11月DB-Engines排行:Oracle归零年内涨幅 PostgreSQL增长第一独秀

2020年11月,DB-Engines 流行度排行已经出炉,本月前十名的位置上,Redis 上升一位,和 Elasticsearch 交换了位置,其他数据库产品位次保持不变。

在11月的排行榜上,分数下降的居多,前十位仅有 3个数据库产品取得增长,分别是 PostgreSQL、MongoDB 和 Redis。其中 PostgreSQL 增长了 12.66 分,是最高的一个。而前三位Oracle、MySQL 和 SQL Server 则分别下降了 23.77、14.74、5.48分。目前,这是 DB-Engines 排行榜上,开源和商业数据库最接近的一次,两者的差距仅仅是 0.25分,开源和商业数据库的交叉点,可能出现在接下来的任何一个月份。

总之,2020年,大数据在多个领域取得巨大的进展,虽然大数据和人工智能带来了大量的技术挑战、法律问题和伦理障碍,但大数据带给世界的好处实在太大,不容忽视。明年大数据行业又会如何?让我们一起期待吧!

留言

评论

${{item['author_name']}} 回复 ${{idToContentMap[item.parent] !== undefined ? idToContentMap[item.parent]['author_name'] : ''}} · ${{item.date.slice(0, 10)}} 回复

暂时还没有一条评论.