Fawkes – 给照片穿上「隐身衣」,秒杀全网最强人脸识别算法,帮你保护照片隐私数据!

10 min


0

网络平台正在泄露你的个人隐私,一张自拍照就能够识别出姓名、联系方式、家庭住址。

这对于面部识别技术来说,可能已经不是什么难事儿。换句话说,只要能够获取到照片数据,面部识别技术就能轻松获取个人敏感信息。

如今,我们在网络上的大量曝光,获取这些照片数据也变得很容易。此前,美国面部识别公司便创建了一个约有 30 亿张图像的超大容量人脸数据库,而这些数据均从 Facebook,Venmo,YouTube 等网络平台抓取而来。

无处不在的面部识别技术和未经授权的数据获取已经对个人隐私造成了严重威胁。面对这些威胁,芝加哥大学 Sand Lab 团队提出了一种新的解决思路——或许我们可以为照片添加一层“隐身衣”!

开源的人脸识别克星 Fawkes

Fawkes 是由芝加哥大学 SANDLab 研究人员开发,针对面部识别系统的隐私保护工具。项目的官方网页查看更多信息。

Fawkes,已经让旷视、微软、亚马逊等公司的面部识别算法失灵。

Fawkes 可以通过 AI 计算,为照片添加一层防识别「隐身衣」,经测试,其已在最先进的面部识别技术中取得了百分百的胜利。

我们先来看一组图片。

相信你很难看出两组照片有任何差别。事实上,后者已经过了 Fawkes 处理,并能够屏蔽任何人脸识别算法。

研究人员介绍,Fawkes 软件对人脸图像进行了像素级的细微更改,肉眼几乎无法察觉到。而任何扫描这些图像的算法都会将这些「高度失真」的图片视为完全不同的人。

而且,Fwkes 的处理速度很快,单个图像仅需要几分钟。

如此说来,经过 Fawks 快速处理的图像,可以在不改变原貌的基础上,随意分享在各大网络平台,而不用担心照片被相关公司随意抓取或用于非法途径。

Fawkes 的命名取自 Guy Fawkes Mask〔盖伊·福斯克面具〕。该面具形象是英国插图画家大卫·劳埃德〔David Lloyd〕以 16 世纪英国阴谋家盖伊·福克斯的脸为原型而创造。最早出现在漫画《V 字仇杀队》中。研究人员以此表示,通过 AI 技术巧妙地,不可察觉地更改照片以欺骗面部识别系统。

研究团队表示,希望 Fawkes 能够被广泛部署和使用,以降低个人隐私泄露的风险。因此,Fawkes 已经完全对外开放,任何人都可以下载和使用,Windows 和 Macs 系统均可以支持。据统计,这款软件已经被下载超过 100,000 次。

官方下载

Fawkes

2020 is a watershed year for machine learning. It has seen the true arrival of commodized machine learning, where deep learning models and algorithms are readily available to Internet users. GPUs are cheaper and more readily available than ever, and new training methods like transfer learning have made it possible to train powerful deep learning models using smaller sets of data.

Fawkes「隐身衣」实现过程

目前 Fawkes 软件已经升级到 V0.3 版本。V0.3 更新了目标选择算法,比此前的 V0.1、V0.2 相比,可显著降低伪装后摄动伪像的可能性。目前,关于它的技术论文已经对外开放。据了解,该论文将在 8 月 12 日至 14 日举行的 USENIX 安全研讨会上正式发表。

论文中表明,在此项研究取得了以下几个关键的发现。

  1. 以肉眼无法察觉的干扰操作,对图像的特征空间进行更改。
  2. 不管跟踪器〔Tracker 〕如何训练其模型,图像伪装都可为用户识别提供 95% 以上的保护。
  3. 输出图片使用 Microsoft〔Azure Face API〕,Amazon〔Rekognition〕和Face ++ 的最新面部识别进行检测,Fawkes 模型可以 100% 成功。

对于以上的研究发现,论文中也给出了明确的说明。我们可以看到,整个系统分为用户图像和模型验证两个阶段。

前者是基于 Fawkes 算法来生成用户图像的伪装版本,后者是通过追踪器〔Tracker 〕从网络资源中检索伪装的图像,并使用它们来训练未经授权的面部识别模型。最终可以发现模型输出的图像与原始图像并不相同。

其中,Fawkes 算法整个系统的关键。在这里,研究人员利用特征提取器 Φ 和目标图像 T,对原始图像进行伪装处理,这些目标图像T均来自可公开获得的数据集〔均大于 500K 〕。

为了确保伪装图像在视觉上与原始图像基本相似,研究人员采用 DSSIM 来衡量二者的差异,实验结果表示,DSSIM 均小于 0.007。〔DSSIM 是衡量用户感知图像失真程度的方法〕。

此外,研究人员认为,通过提高用户特征提取器的鲁棒性来实现可移植性。这一目标需要通过对抗训练来完成。该训练采用扰动数据训练模型,可以使输入的目标图像不那么敏感。

具体来说,对于每个特征提取器,使用 PGD 攻击〔一种广泛用于对抗训练的方法〕来生成对抗示例,然后将更新后的特征提取器用于在 PubFig 和 FaceScrub 数据集上生成用户伪装图像。

结果表明,每个强力的特征提取器都会产生隐身衣〔Cloaks〕,而且这些隐身衣几乎可以完美地转移到跟踪器的模型中。可以看到,跟踪器使用其他特征提取器时,其隐身衣的保护成功率均大于 95%。

最后为验证图像实际的伪装效果,研究人员将经过 Fawkes 处理过的图像泄露给了基于云平台的面部识别系统,包括 Microsoft Azure Face,Amazon Rekognition 和 Face ++ 。

这些是面部识别系统是全球最领先技术,被广泛用于美国和亚洲的企业,警察,私人实体以及政府。结果来看,Fawkes 对图像的保护率达到了 100%。

需要了解论文详细内容,可点击链接:https://www.shawnshan.com/files/publication/fawkes.pdf

使用教程

Shawn-Shan/fawkes

Fawkes is a privacy protection system developed by researchers at SANDLab, University of Chicago. For more information about the project, please refer to our project webpage. Contact us at [email protected] We published an academic paper to summarize our work ” Fawkes: Protecting Personal Privacy against Unauthorized Deep Learning Models” at USENIX Security 2020.

快速开始

PyPI 安装:

pip install fawkes

如果没有 root 权限可以尝试

pip install --user fawkes

命令

$ fawkes

参数

  • -m--mode
    指定隐私和干扰等级:minlowmidhigh
    干扰等级越高,对图像的干扰越大,并提供更强的保护。
  • -d--directory
    指定要操作的图片目录。
  • -g--gpu
    使用 GPU 进行优化时指定的 GPU ID。
  • --batch-size
    批量优化的图像数量。仅当有强大的计算能力时,才更改为> 1。
  • --format
    指定输出图像的格式〔png 或 jpg〕。

当–mode 为custom

  • --th :干扰阈值
  • --max-step :要运行的优化步骤数
  • --lr :对优化操作的学习率
  • --feature-extractor :要使用的特征提取器的名称
  • --separate_target :是否为目录中的每个面孔作为单独的不同目标。

示例

fawkes -d ./imgs --mode min

提示

  • 在 CPU 机器上,每个图像的干扰操作大约需要 60 秒,而在 GPU 机器上,操作要快得多。
    CPU batch-size=1
    GPU batch-size>1
  • 如果目录中的图像属于不同的人,则使用命令 --separate_target,否则将其关闭。
  • 在 GPU 上运行。当前提供的 Fawkes 软件包和二进制文件不支持 GPU。
    要使用 GPU,您需要克隆它,在安装所需的软件包setup.py,然后将 tensorflow 替换为 tensorflow-gpu。然后,您可以通过运行 Fawkes python3 fawkes/protection.py [args]

Like it? Share with your friends!

0

What's Your Reaction?

喜欢 喜欢
0
喜欢
不喜欢 不喜欢
0
不喜欢
路过 路过
3
路过
安排了 安排了
3
安排了
厉害了 厉害了
2
厉害了
Diss Diss
2
Diss
怕不怕 怕不怕
2
怕不怕
不可描述 不可描述
1
不可描述
wtf wtf
1
wtf
DUN

Choose A Format
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Video
Youtube, Vimeo or Vine Embeds