什么属于元数据?
- 如果使用 GPS 功能设备(如智能手机)拍摄照片的位置(纬度和经度坐标);
- 相机设置,如 ISO 感光度、快门速度、焦距、光圈、白平衡、镜头类型等(请注意,有些相机确实包含位置坐标);
- 相机或智能手机的型号;
- 拍摄照片的日期和时间;
- 用于编辑照片的程序的名称;
PDF 文件
- 作者姓名,通常是首次安装用于创建文件的程序时分配的名称;
- 用于创建文件的程序的版本和名称;
- 文件的标题;
- 某些关键字;
- 文件创建 / 上次修改的日期和时间;
- 文本文件;
根据用于创建文档的程序,数据可能包括
- 所有不同作者的名字;
- 在以前版本的文档中删除的文本和注释行;
- 创建和修改日期;
影片
视频文件中的元数据可分为两部分:
- 自动生成的元数据:创建日期,大小,格式,编解码器,持续时间,位置;
- 手动添加的元数据:有关素材的信息,文本转录,标签,更多信息以及编辑的注释等等;
* 推荐阅读:全面了解视频元数据并与 WITNESS 合作。
- 音频元数据类似于视频,但更广泛地用于注册文件的属性。除此之外,还可以包括:创建日期,大小,格式,编解码器,持续时间和一组手动添加的数据,如标签,艺术家信息,艺术作品,评论,专辑中的曲目编号,流派等等。
通讯
通信中的元数据取决于所使用的通信类型(即电子邮件,移动电话,智能手机…… 等)。但总的来说,它可以揭示以下内容(如果没有使用隐藏元数据的工具的话):
- 发送者和接收者的 ID;
- 沟通的日期和时间;
- 地点;
- 沟通方式.. 等等;
实例
有各种方法可以揭示或查看元数据,有些工具可以读取内置文件信息的元数据(例如 Photoshop),这意味着它们将以其格式显示数据。其他的则有更详细的输出。
▼ 使用 CyanogenMod 的 android 手机拍摄的照片。不显示地理位置或使用的手机类型:
▼ 用 iPhone 拍摄的照片。请注意显示的额外详细信息,包括地址、电话类型、相机类型和使用的程序。
元数据工具
小提醒: 使用在线平台提取元数据时,牢记数字隐私和安全非常重要。没有足够的信息来保证流程的机密性。这些平台可能会跟踪您的在线行为,存储您的数据或与第三方或当局共享。
除了包含元数据功能的软件(如 Photoshop,Adobe Acrobat 等)之外,也有专门查看元数据的工具。
免费开源并支持 Windows,mac OS 和 Linux 的工具。
它依赖于命令行。涵盖的文件格式和它给出的结果是相当全面的。ExifTool 允许用户读取、编写和编辑元数据。
这是一个基于 Phil Harvey 的 ExifTool 的在线工具,可以选择上传图像或在线使用图像的 URL。提供一个添加到 Mozilla 或 Safari 的按钮,允许更快地提取元数据。
3. Exifer
这是一款基于 Phil Harvey 的 ExifTool 的在线工具。它可以直接访问 DropBox,Flickr 和 Google Drive。用户可以从 Exifer 网站登录并直接从那里编辑图像。Exifer 有一个隐私声明「图片将被临时下载,只是为了让你编辑它们。一旦您刷新本网站的主页,临时文件将被删除,或者在下载时间 15 分钟后自动删除。」
这是一个在线工具,可让您上传图片或粘贴 URL。虽然它允许用户匿名访问和使用网站,但网站上发布的隐私政策,详细说明了他们和其他第三方在平台上收集的数据类型。
5. CameraV
这个我们已经多次提到了。CameraV 是由卫报项目和 WITNESS 创建的免费开源的 Android 应用。应用程序名称中的 V 代表验证,它是为了向照片或视频添加大量额外元数据而创建的,以验证其真实性。这个软件做了两件事。首先,它描述了图像和视频的人物,内容,时间,地点,原因和方式。其次,它建立了一个可以在法庭上指出的监管链。对于公民记者取证来说,非常好用。
开源免费的应用,正如其名字所示,该脚本允许在 Linux 和 macOS 上,从大量图像中提取地理定位元数据。在处理大量图像时,它可以节省宝贵的时间。由 Exposing the Invisible 团队成员编写的脚本应放在名为 geobatch.rb 的文件中,并在包含其中所有图像的文件夹中运行。
7. TrashEXIF
TrashEXIF 是一款 iPhone 应用程序,允许用户从图像中删除所有元数据或控制应删除或保留哪些元数据。该应用程序还允许预设应用于所有拍摄图像的协议。
保护元数据
有多种方法可以从文件中删除元数据。以下是来自 Security in-a-Box 工具包的一些建议。
设备设置
您可以通过以下方式阻止捕获 GPS 位置等特定类型的元数据:
- 关闭无线和 GPS 位置(位置服务下)和移动数据(可以在数据管理器 →数据传输下找到);
- 拍摄照片时,请确保照片应用程序中标记位置的设置也已关闭;
- 使用 Metanull(适用于 Windows)等工具,您可以确保在共享之前删除所有元数据。下面详细讨论该工具。
注意: 一些文件(如 DOC 和 PDF)可以在其中保存图像。如果只是清除了文档的元数据,将依旧保留被嵌入图像的元数据!在将图像添加到文档之前,请先从中删除所有元数据。
删除元数据
如上所述,其他常用文件类型(如可移植文档文件(PDF)或由 Microsoft Office 或 LibreOffice 等应用程序创建的文字处理文档)包含元数据,其中可能包括:
- 创建文档的人员的用户名;
- 最近编辑和保存文档的人员姓名;
- 创建和修改文档的日期。
在某些情况下,您的文档可能还包含其他个人身份信息,例如地址,电子邮件地址,政府 ID,IP 地址或与您计算机上其他程序中的个人身份信息相关的唯一标识符。
通过查看文件属性(可以通过右键单击文件图标并选择‘属性'来访问),可以轻松访问其中一些信息。查看其他信息或隐藏性数据则需要特定的软件。在任何情况下,根据环境的不同而异,如果您正在交换敏感信息,此数据就可能会使您面临风险。
从 PDF 文件中删除元数据
Windows 或 MAC OS 用户可以使用 Adobe Acrobat XI Pro(提供试用版)等程序从 PDF 文件中删除或编辑隐藏数据。
使用 Acrobat 打开任何 PDF 文件将允许您通过转到 “文件” 菜单然后选择属性来编辑元数据。在这里,您可以修改文档作者的姓名、标题、主题、关键字和任何其他元数据。您可以通过转到 “工具” 菜单,然后选择 “保护”,再选择 “删除隐藏的信息”,从而删除有关创建时间、修改时间、用于创建文件的设备类型以及您未看到的其他隐藏性数据的信息。
对于 GNU / Linux 用户,PDF MOD 是一个免费的开源工具,用于编辑和删除 PDF 文件中的元数据。但是,它不会删除创建或修改时间,也不会删除用于创建 PDF 的设备类型。
从 LibreOffice 文档中删除元数据
在 LibreOffice 文档中,可以通过选择 “文件” 菜单,然后选择 “属性” 来查看元数据。在 “常规” 选项卡下,可以单击 “重置” 以重置常规用户数据,例如总编辑时间和修订号。您还可以通过取消选中此屏幕上的 “应用用户数据” 复选框,以便删除创建者的名称。完成后,转到 “描述” 和 “自定义属性” 选项卡以清除您不想显示的任何数据。最后,单击 Securit ** 选项卡并取消选中 * Record 更改框,如果默认情况下未取消选中它的话。
注意:如果使用 Versions 功能,则可以通过转到 “文件” 菜单和 “版本” 来删除可能存储在其中的旧版本文档。如果您使用 “更改” 功能,请转到 “编辑” 菜单,然后单击 “更改” 以接受或拒绝清除与文档所做更改相关的数据(如果您不再需要此信息的话)。
用于清理元数据的其他策略
某些文件类型包含的元数据多于其他文件类型,因此如果您不想使用软件,并且文件的格式无关紧要,您可以从包含大量元数据的文件中做出更改(例如 .DOCs 和 .JPEGs)变成(例如 .TXTs 和 .PNGs)。
在注册 Microsoft Office,Open Office,Libre Office,Adobe Acrobat 等软件的副本时,请避免使用您的真实姓名、地址、公司或组织名称。如果您必须提供姓名或地址,请使用假名。
工具们肯定会越来越好用,越来越服务于大众。隐私不应该是技术精英的特权、获知真相也不应该被资金雄厚的企业媒体所垄断。民主需要公民行动起来,智慧和能力应该是您最好的装备。