硅谷速递 | 迈入万物识别时代,靠“脸”吃饭行得通吗?

by June 2020-10-12

硅谷不仅是世界高科技中心,也是新时代的灵魂,作为全球创新的聚集地,无论是基础的技术创新,还是下一代的技术应用创新,都有一批又一批的技术与应用来自“硅谷创新”。在硅谷我们不仅能看到专注于技术本身的创新科技,同时也能够看到一些真正好的技术与市场化的应用。我们希望大家有机会可以多去硅谷看一看,但是如果不能身临其境到硅谷,那么来到【硅谷速递】就是你最省时、最省力地获取硅谷最新科技动态的不二选择。

在这里我们将为大家速递美国硅谷最精彩、时效性最强的科技文章和学习资料,简约不简单是本栏目的最大特点,3篇短小精悍的文章,助你快速精准Get一项最新技术点!把握技术风向标,了解行业应用与实践,就交给【硅谷速递】吧~

速递先知

本期三篇超实用的硅谷前沿技术文章,从人脸识别技术的概念、难点以及未来趋势,带领大家走进「人脸识别」的新世界:

  • 年均开销3500万美元的 FBI 机密部门将面部识别与大数据相结合,以调查美国最恐怖的犯罪
  • 为什么IBM放弃了面部识别技术?
  • 厌倦了AI引擎抓取你的照片进行面部识别?给照片穿上“隐身衣”

年均开销3500万美元的 FBI 机密部门将面部识别与大数据相结合,以调查美国最恐怖的犯罪

大规模枪击案或恐怖袭击后,数小时的电视录像、现场证人或社交媒体的视频,可以供调查人员破案。以2013年波士顿马拉松爆炸案为例,联邦调查局收到了13,000多个视频,并有120位分析师对其进行了分析。

那么,FBI 是如何提高在重大犯罪现场通过充足的视频材料进行筛选的呢?原来一个从未被提及的法务部门即多媒体开发部门(MXU)在做此项工作。联邦调查局科学与技术部门原负责人克里斯·皮耶塔称,该部门是联邦调查局内的一个小型专业部门,其重点是开发用于分析重大犯罪现场图片和视频的软件。而Mitre则是该部门最大的技术和服务提供商,获得了近2000万美元的合同。

皮耶塔说:“如果你要从可怕的场景或事件中收集TB级的视频信息,MXU则附带了他们的工具,帮助调查人员使该录像解析出无关镜头。他们为视频录像中的相关调查信息提供分析和识别,是过去几年美国发生的所有大规模枪击事件的关键。”

早些时候,福布斯公布了一项Mitre-FBI项目的工作,该项目从Facebook,Instagram和Twitter等社交媒体网站中的图像获取人们的指纹。两者还共同建立了下一代身份识别系统,FBI称这是“世界上最大、最高效的生物特征和犯罪历史信息电子存储库”。在美国,任何执法机构都可以在这里查找犯罪嫌疑人的指纹、面部表情或其他生物特征信息。

Mitre与执法部门的合作不仅局限于侦探,还担任保护FBI自身数据方面的工作,要求Mitre确保FBI的信息和技术部门为该机构的“最高机密、机密和未保密”信息库制定访问规则。由于Mitre为FBI所做的大部分工作既包括针对性监视也包括大规模监视,因此该非营利组织工作将保密。

说到人脸识别(Face Recognition),它是一种依据人的面部特征(如统计或几何特征等),自动进行身份识别的一种生物识别技术,通常我们所说的人脸识别是基于光学人脸图像的身份识别与验证的简称。

计算机是如何识别人脸的?为什么又需要大数据?具体而言,采用特征点识别物品时,需要有大量数据作为特征点。例如搜索“范冰冰”的照片,首先必须有足够多的范冰冰照片,然后告诉“机器”这是范冰冰。机器从每张照片里提取特征点,最终所有特征点组成的集合被称为特征点集。有了这个特征点集,那么你上传“一张照片”时,计算机就知道这张照片是谁了。

由此可见,大数据的重要性,以识别范冰冰为例,数据库里采样照片越多,计算机识别率越高。如果采样足够多,就能更好的实现“机器学习”。而机器学习就是让机器根据现有的照片来判断其它照片是不是要查询的图片,如果是则自动提取新特征点,如果不是则忽略,这种机器学习会产生马太效应。

事实上,在很多情况下我们无意识的给机器提供了“人工训练”。例如在登录谷歌网站时,谷歌需要让你判断图片验证码,你必须全部选对才能验证通过。通过这个步骤,谷歌就可以比对“人工判断”和“机器判断”是否一致,这种判断也为谷歌“自动驾驶”提供了更多数据。

为什么IBM放弃了面部识别技术?

最近美国的种族平权运动声势浩大,就连科技公司也参与到这场运动中来,IBM甚至因此而干脆放弃了一项颇有前途的业务,那就是人脸识别。


警方机构使用面部识别技术仍有持续争议

IBM 公司 CEO Arvind Krishna宣布,该公司将退出人脸识别业务,因为该技术被指涉及种族和性别歧视。

Arvind Krishna表示:“IBM坚决反对,也不会容忍使用任何技术来监视大众、种族定性、侵犯基本人权和自由以及从事任何与我们的信任和透明度价值观和原则不一致的目的,包括其他公司提供的人脸识别技术。”

他在提交国会的文件中提议,应该开始展开全国性对话,讨论执法部门是否应该以及如何部署人脸识别技术。

事实上不止IBM和人脸识别,很多公司的一些传统项目也在发生变化,比如谷歌的Chrome浏览器也在放弃一直使用的“黑名单”说法,而改成不那么带有种族偏见的词汇。

除了没有完善的专门针对人脸识别技术及其相关技术的详细监管机制以外,人脸识别发展至今三四十年,仍存在诸多难点没能彻底解决。

1、光照问题,光照问题是机器视觉的老问题,在人脸识别中的表现尤为明显。由于人脸的3D结构,光照投射出的阴影,会加强或减弱原有的人脸特征。

2、表情姿态问题,涉及头部在三维垂直坐标系中绕三个轴的旋转造成的面部变化,其中垂直于图像平面的两个方向的深度旋转会造成面部信息的部分缺失。

3、遮挡问题,特别在监控环境下,被监控对象佩戴的饰物,使得采集的人脸图像有可能不完整,影响后面的特征提取与识别,甚至导致检测算法失效。

4、年龄变化,人类容貌随着年纪会发生比较大的变化,从而导致识别率的下降。对于不同的年龄段,人脸识别算法的识别率也不同。

5、人脸相似性,所有人脸的结构都相似,这样的特点对于利用人脸进行定位是有利的,但对于利用人脸区分人类个体是不利的。

6、图像质量,人脸图像的来源可能多种多样,由于采集设备的不同,得到的人脸图像质量也不一样,特别是对于那些低分辨率的人脸图像,如何进行有效地人脸识别是个需要关注的问题。

7、样本缺乏,基于统计学习的人脸识别算法是目前人脸识别领域中的主流算法,但是统计学习方法需要大量的训练。由于人脸图像在高维空间中的分布是一个不规则的流形分布,能得到的样本只是对人脸图像空间中的一个极小部分的采样,如何解决小样本下的统计学习问题有待进一步的研究。

8、海量数据,传统人脸识别方法如PCA、LDA等在小规模数据中可以很容易进行训练学习。但是对于海量数据,这些方法其训练过程难以进行,甚至有可能崩溃。

9、大规模人脸识别,随着人脸数据库规模的增长,人脸算法的性能将呈现下降。

厌倦了AI引擎抓取你的照片进行面部识别?给照片穿上“隐身衣”

左右两张图,你能看出区别吗?

其实,算法已经悄悄给右边的照片加上了微小的修改。

但就是这样肉眼根本看不出来的扰动,就能100%骗过来自微软、亚马逊、旷视——全球最先进的人脸识别模型!

据纽约时报,芝加哥大学SAND实验室的研究人员,开发了一款AI视觉工具Fawkes,通过建立庞大的人脸数据库,伪造具有像素级变化的照片,使面部识别系统感到困惑,从而保护用户隐私安全。针对最新的面部识别模型具有100%的有效性。

比如,在图像里加上一点噪声,熊猫就变成了长臂猿:

Fawkes就是利用了这样的特性。用 x 指代原始图片,xT为另一种类型/其他人脸照片,φ 则为人脸识别模型的特征提取器。

Fawkes背后的研究人员表示,他们正在研究macOS和Windows工具,以使其系统更易于使用。

未来发展趋势的思考:随着人工智能的火热和发展,在云计算、大数据的背景下,生物识别技术的应用面会越来越大,由以人脸识别为其中代表,则有以下几个发展趋势呈现:

网络化趋势:人脸识别解决了日常生活中基本的身份识别问题,我们可以看到身份识别认证已经与各行各业应用结合起来,并通过互联网和物联网得以信息共享,简单来说就是“身份识别+物联网”的发展趋势未来将十分普遍。

多生物识别模式融合趋势:人脸识别技术如今还达不到人类的预期体验,对于一些安全性要求高的特殊行业应用,人脸识别很容易被不法分子攻破漏洞进行身份造假,因此需要多种生物特征识别技术的融合应用(如活体检测、虹膜识别等)以进一步提高身份识别的整体安全性。

云技术:未来的云技术也将大大给人脸识别的应用提供数据和计算力支持,基于云技术的门禁控制可以同时管理成百上千的通道,加上物联网的普及,用户能够对任何地方的门禁进行远程控制和管理。

不难看出,人脸识别技术是未来基于大数据领域的重要发展方向。例如,如今公安部门引入大数据,弥补传统技术难点,通过人脸识别技术使得这些照片数据再度存储利用,大大提升公安信息化的管理和统筹,这将成为未来人脸识别的主要发展趋势。

参考文章:

【1】Thomas Brewster.This Secret $35 Million FBI Unit Mixes Facial Recognition With Big Data To Investigate America’s Most Horrific Crimes
【2】Tim Bajarin.Why It Matters That IBM Has Abandoned Its Facial Recognition Technology
【3】Thomas Claburn in San Francisco.Sick of AI engines scraping your pics for facial recognition? Here’s a way to Fawkes them right up

留言

评论

${{item['author_name']}} 回复 ${{idToContentMap[item.parent] !== undefined ? idToContentMap[item.parent]['author_name'] : ''}} · ${{item.date.slice(0, 10)}} 回复

暂时还没有一条评论.