“从视频中学习”——Facebook启动新AI项目，IBM早早探索出AI视频解析新方法？| 硅谷速递

by June 2021-03-25

随着我们日渐掌握越来越强大的计算能力、更先进的计算算法、更易用的软件系统，以及不断下降的数据存储成本，我们正在具备对无处不在的大量视频进行实时分析的能力。

Facebook启动Learning from Videos项目，尚不明确将会抓取多少用户视频做测试

3 月 12 日，Facebook 研究团队表示将启动一个“从视频中学习”（Learning from Videos）的项目。具体而言，是将通过人工智能对上载到网络上的语音、图片以及视频资源进行学习处理。该项目的推出，将一定程度上能够完善和增强 Instagram Reels 的推荐功能，从而更加精准地匹配用户所需与平台资源之间的衔接。

机器学习最大的困难，或许就在于它不能像人一样，针对具体场景做出具体情境下的判断、结论，虽然这个过程具有一定的逻辑性，但它并不会完全等同于人脑的理解。

Instagram 海量视频和图片的实验

Facebook 将利用 Instagram 庞大的十亿张公开照片数据库，进行抓取、识别和处理，以此展开 AI 智能人工训练，获取自己在行业的技术领先地位。

比如，在当前同一视频或者图像下，可通过该程序准确识别和判断其背后的相关内容和视频资源，实现用户与平台资源的匹配对接。与此同时，”从视频中学习“这一项目的优越性还表现在对于语音识别方面的容错率有了大大的降低。换言之，相比于传统的语音识别和文本转化，”从视频中学习“这一人工智能程序可以大大降低错误。

相关研究人员在博客中写到：“通过学习遍及几乎每个国家和数百种语言的全球公开视频流，我们的 AI 系统不仅可以提高准确性，还可以适应我们快速发展的世界，并认识到不同文化和地区之间的细微差别和视觉。”

AI 解析视频，数据铺就商业道路

通过“从视频中学习”，能够更进一步地识别检测恶意非主流价值观的言论，达到净化社交空间的目的。但也不可否认，在理解视频语言，转化语音文本的同时，囿于用户、视频资源等自身属性——譬如噪音、视频角色转化等问题，“从视频中学习”系统也必然存在一定程度的识别难度，鉴于这种难度，可能就此造成识别上的歧义。

此外，Facebook 还表示，机器学习的未来，应用前景非常广阔，它甚至会影响到我们生活的角角落落。诚然，能够理解视频内容、思想的人工智能可以让 Facebook 更好地洞察用户们的生活习惯、爱好兴趣，以及思维方式等等。建立在对用户有着足够多、多维度了解的基础上，就能匹配给用户相应的视频内容，这个过程也是一种价值观念的植入，是思想情绪的引导。通过以上种种方式，带给用户全新的体验。

麻省理工学院和IBM探索出一种让人工智能轻松解析视频的方法

早在两年前，麻省理工学院(MIT)和IBM的一个团队就开发了一种算法，只消耗以前所需处理能力的一小部分，就能够准确识别视频中的动作，这可能会改变将人工智能应用于大量视频的经济效益。该方法采用了人工智能的方法来处理静态图像，给它一个粗略的时间概念，或将有助于控制目前网络上每时每刻都在生成的大量内容。

尽管科技公司喜欢炫耀它们对人工智能的使用，以及让人眼花缭乱的所谓成果，但实际上，利用人工智能分析视频方面的应用仍然不多。YouTube、Facebook和TikTok使用机器学习算法对视频片段进行分类和推荐，但它们似乎主要依赖于与视频相关的元数据，比如说描述、标签以及上传的时间和地点。所有人都在研究分析视频内容的方法，但这些方法无一例外，全都需要更多的计算能力。

公司希望使用人工智能自动生成视频的详细描述，让用户发现没有注释的视频片段，同时也愿意出售基于视频内容的广告。Facebook和谷歌也希望使用人工智能来自动发现和过滤非法或恶意内容，尽管这看起来像是一场正在进行的猫抓老鼠游戏，但是在不显著增加人工智能碳足迹的情况下，完成这个游戏其实非常艰难。

随着企业利用人工智能分析视频，近年来，图像识别技术取得了很大进展，这在很大程度上要归功于深度学习。深度学习算法可以根据图像中显示的像素来检测目标，但它却不太擅长解释视频。

分析一个视频帧不会揭示出发生了什么，除非将该帧与之前和之后的帧进行比较，这涉及到连贯性问题。比如说一个人匆匆出门，可能是急着去办什么要紧事，也可能是发生了地震，再或者，这个人是小偷，得手后匆匆离场。有因必有果，由起因推导出结果，或者根据结果推导起因，从而得知过程，这是一种逻辑思考方式。

因与果像是素材，而麻省理工的研究人员就很聪明地利用了这一根本点，他们把素材进行了精简，比若说把3D的图片转化为2D，这无疑会节省很多数据计算量，通过这种方式，无疑会大大减少计算的量，人工智能“工作”起来自然也就比之前轻松。

这种方法一旦功成，所带来的利益将是巨大的。因为在计算力愈发重要的当代，能够解放计算力的方法意味着什么，不言而喻。

基于AI的视频分析正在推动智能社会的到来

当人工智能技术在视频分析中成为常态应用时，社会发展、商业运营，以及我们的生活方式都将发生潜在的、不易察觉的变化。

1.更安全的商业场所

在当前的在实体商店中，我们随处可以看到无处不在的摄像监控或一定数量的安保人员，来防止各种盗窃行为。但在目前，主动监控摄像存在成本高、无法实时报警等缺陷。

而基于AI的视频分析技术可以实时分析视频中的人员动作，监测盗窃行为，并及时报警，让传统的监控系统变成实时预警系统，大幅提高对犯罪行为的打击效率，有效保障商业场所的安全。

2.更精准的广告营销

在商业领域，消费者行为与兴趣偏好是商家非常关注的因素，这让商家可以根据消费偏好及时调整产品种类、摆放位置和促销策略等。

当视频分析技术可以为商家提供更强大、更精准的分析结果时，可以以前所未有的方法来提高顾客参与度，进而更好地安排商店和货物的布局。机器学习算法还可以与移动广告营销技术、室内定位技术相配合，为消费者提供更精准、个性化的广告营销信息。

3.更自动化的生产管理

在工业领域，基于AI的视频分析技术将为企业提供更加先进的生产线与供应链管理系统。视频监控系统可以用于检测产品故障，通过机器视频及算法，快速找出有瑕疵的产品，优化生产制造流程。

通过传感器和AI算法的预测性维护技术也正在被越来越多的工厂所使用。通过实时监测生产设备的运行情况，可以及时提供生产预警，减少设备维修造成的损失。

在仓库管理方面，借助视频分析，仓库管理人员可以依靠自动跟踪技术，找到更高效的仓库管理方法。

4.更智能的交通系统

智能视频分析系统可以提升和改进城市交通的规划与管理水平。通过对居民出行方式及路线的连续分析，可以帮助城市管理者加强对道路、桥梁等基础设施的维护与改进。

另外，交通管理系统可以分析每个路人和车辆的动态，并进行预测性分析，让交通管理更加高效，同时可以减少公共设施的破坏行为，保障行人和车辆的安全。

5.更轻松的医疗管理

过去几年，视频技术是很多初创公司进行医疗领域的切入点。例如，视频技术已经成为远程医疗的重要工具，通过医患双方的在线视频沟通，可以让患者就诊更加方便，还可以加强医疗机构之间的沟通与协作。

在医疗机构，视频服务还可以帮助医生和护士更好地管理病患。例如，患有阿尔茨海默氏症的患者非常容易走失，通过面部识别技术，可以在患者离开时及时响应，并提醒医护人员。

6.更高效的公共安全保障

当前，很多国家都在利用面部识别技术打击犯罪份子，而且卓有成效。未来，执法机构将越来越多地依赖人工智能技术打击犯罪。

融合了人工智能的视频分析技术还可以通过人体动作的变化，提前预防犯罪，这将大幅提升执法效率，降低犯罪率。例如，我国警方已经使用银河水滴公司的步态识别技术，借助AI打击犯罪。

总体而言，人工智能介入视频分析领域，将让整个城市建立起更强大的视觉系统、感官系统。这种升级不只是能够提高整个城市的分析能力，更重要的是提供对一切线索的预测能力。而这一切应用，都将推动一个更为智能的社会的到来。

文章来源：

ATYUN 《一种让人工智能轻松解析视频的方法》

DeepTech深科技《Facebook启动Learning from Videos项目，尚不明确将会抓取多少用户视频做测试》

资本实验室《基于AI的视频分析正在推动智能社会的到来》

“从视频中学习”——Facebook启动新AI项目，IBM早早探索出AI视频解析新方法？| 硅谷速递

Facebook启动Learning from Videos项目，尚不明确将会抓取多少用户视频做测试

麻省理工学院和IBM探索出一种让人工智能轻松解析视频的方法

基于AI的视频分析正在推动智能社会的到来

留言

评论

“从视频中学习”——Facebook启动新AI项目，IBM早早探索出AI视频解析新方法？| 硅谷速递

Facebook启动Learning from Videos项目，尚不明确将会抓取多少用户视频做测试

麻省理工学院和IBM探索出 一种让人工智能轻松解析视频的方法

基于AI的视频分析正在推动智能社会的到来

留言

评论

麻省理工学院和IBM探索出一种让人工智能轻松解析视频的方法