开源调查入门,通过一张照片找到你

5 min


2011 年,一则名为《我是如何推理出王珞丹住址的?》的帖子被疯狂转载。帖子作者凭借王珞丹几条微博、自己对北京城的了解和 Google Earth,用时四十多分钟就推理出了王珞丹前住址。〔王珞丹是彼时大火的职场剧集《杜拉拉升职记》主演,当红女明星,暴露年龄的作者注。〕GGMM 们在惊呼「碉堡了」之余,不免担心自己也会被调查一番,纷纷表示再也不敢在网上发东西了。

相关报道。图自 搜狐传媒

十年后的 2021 年,在众多爱好者和创作者的引介下,一种被称为「迷踪」的侦探游戏进入大众视野:在只有一张和寥寥提示的条件下,大神们仅凭一台联网的电脑,足不出户即可找到图片拍摄地,有的甚至能确定拍摄时间。如今的网友们在惊呼「卧槽牛批」之余,不免担心自己也会被调查一番,纷纷表示再也不敢在网上发东西了。

炒饭社区网络迷踪板块。图自 炒饭社区

B 站 up 主「我是 EyeOpener」是较有影响力的网络迷踪引介者之一。图自 bilibili

互联网的历史是「毅种循环」,但循环是螺旋上升的。十年间全球网民数量翻倍,网页数量翻了两番,虽然我们都没什么长进,但这种调查技术已在海量互联网信息加持下日趋成熟。它的正式名字叫做开源调查〔Open Source Investigations, OSI〕或开源情报〔Open Source Intelligence, OSINT〕,指利用互联网上的开源信息展开调查的技术。

「网络迷踪」是开源调查最具影响力的一种形式,因为它看上去极具戏剧性:一张图片就能准确定位。但这种戏剧性源于人们低估了一张图片所能包含的信息量,以及互联网开源信息的规模和广度。你是否担心自己的照片会暴露?你是否好奇侦探们如何抽丝剥茧得出拍摄者的位置?今天,经过这篇文章的介绍,你也可以揭开网络迷踪的神秘面纱,成为一名网络侦探,成为自己的网络内容安全专家。

网络迷踪的玩法

炒饭社区是一个类似于贴吧的兴趣聚合,其 网络迷踪版块 在圈内极有影响力。每天,很多饭友在此处发布自己拍摄的照片,向「侦探们」发出挑战。版主团队定期举办网络迷踪积分赛,得胜还有精美奖杯相送。〔非广告,特此声明。尚未注册的作者注。〕

炒饭社区网络迷踪板块的内容。图自 炒饭社区

并不是所有图片都适合成为一道谜题。在炒饭社区,谜题图片集中在城市建筑、交通〔尤其是飞机高铁〕、道路、景点等几类内容上,且以远景为主。如果拍一张自己桌上的摆件,或者路边小花小草,侦探们是很难从图片内容中获得有效信息的。

网络迷踪的基本思路可分为如下三步:

  1. 提取:仔细观察图片,提取其中所有有效信息。无论它多么细小和模糊,都不能放过;
  2. 分析:利用自身知识储备和互联网工具分析所得信息,缩小排查范围;
  3. :运用互联网工具展开排查,直至完分析阶段获得的排查范围。如果未能成功找到,返回前两步再试。

提取和分析信息是网络迷踪的关键,也是其乐趣所在。这有赖于侦探们广博的知识面、强大的互联网信息检索能力和长期的经验积累。

网络迷踪侦探更倾向于通过逻辑推理而非暴力破解得出答案,推理过程越难,得出答案的成就感越强。考虑到现实的复杂性,这一推理过程并不严格,更多是基于生活经验的大概率推测。

图片中隐藏着什么?

要成为合格的网络迷踪侦探,第一步就是会看图,能够挖掘出图片中的隐藏信息。笼统地说,一张图片可以包含以下几方面信息:文字信息、基础设施信息、自然地理信息。

文字信息

文字信息是推测地理位置最快速简单的方式。相比其他种类信息,文字信息优势巨大:

  • 可能直接透露位置:路牌、政府机关大楼、车站站名、门牌号等文字信息都与地理位置强关联,很容易成为送分题。
  • 没有专业门槛:你可能需要一定的专业知识和比对分析过程才能确定植物的品种、飞机的型号,而解读文字信息完全不需要这些,能认字即可。
  • 便于搜索:你可以直接在搜索引擎里搜索文字。虽然很多搜索引擎支持以图搜图,但其准确性尚不能与文字相比。

因此,网络迷踪侦探不会放过图中任何文字信息,即使它模糊不清也要辨识一番。

例如,给出下面一张图片,询问拍摄者位置:

第一道谜题图片,由作者拍摄。

这是一家沙县小吃店。但直接搜索沙县小吃并不是个好主意——全国沙县小吃店数以万计。仔细观察图片细节,可以发现多处文字信息:隔壁「* 记」,门窗倒影上有「王府」、「旺基」,门牌号「香榭 *」、「23*」,电动车挡泥皮上「星桥莫拉克专卖店」的广告。

电动车很少跨城市,因此可以通过其牌照和挡泥板广告推断拍摄地所在城市。牌照上城市字样模糊不清,只能看出是两个字,于是从挡泥皮入手。

在全国范围搜索「星桥」,排除「三星大桥」之类的模糊匹配项,剩余可能项有 12 个:浙江省杭州市星桥街道、湖州市星桥村,福建省三明市星桥村、福清市星桥村,四川省资阳市星桥村、广安市星桥村、广元市星桥村,重庆市星桥镇,云南省丽江市星桥村,湖南省邵阳市星桥村、株洲市星桥村,湖北省咸宁市星桥村。从门窗倒影来看,此地商业活动密集,并不像是普通农村。

全国范围内的「星桥」〔部分〕。图自百度地图

广告上还提供了「莫拉克专卖店」的手机号。众所周知,我国手机号前三位代表运营商,中间四位为地区编码,所以手机号前七位足以确定号码归属地。这未必一定是拍摄者所在地,但大概率是真的。

手机号比较模糊,前七位中能够看清的数字是「1508*64」,第五位像 3、5 或 8。查询可知,1508364 属江西新余,1508564 属贵州遵义,1508864 属浙江杭州。比对星桥的搜索结果,只有杭州市重合。因此,可以暂且假定拍摄者位于杭州,展开下一步搜索。

接下来注意到门牌号「香榭 *」、「23*」。门牌的内容有可能是道路名、小区名、村镇名。考虑到附近商业密集,此处较大可能是道路名。「香榭」后内容被遮挡,从比例位置来看尚余一字,应该是「路」、「街」之类。

在杭州市搜索「香榭路」,果然找到一条名为香榭的道路,属星桥街道。

杭州市星桥街道香榭路。图自百度地图

在该区域搜索沙县小吃,找到一家「疑似目标」:

疑似沙县小吃店。图自百度地图

可惜街景较旧,没有找到与图片类似的店面。但建筑风格和路牌格式均相符。

香榭路全景图。图自百度地图

在美团上能够找到这家店铺,门牌号为「香榭路 23-1 号」,店面图片与谜题图片一致。至此,确定拍摄者位置在浙江省杭州市临平区香榭路 23-1 号沙县小吃门口附近。

沙县小吃天都城店。图自美团

以上便是一道网络迷踪 送分题,因为仅需分析文字信息即可得出答案。

基础设施信息

大到城区,小到垃圾桶,基础设施包罗万象,涵盖市政、交通、建筑等领域。根据基础设施展开网络迷踪,理论依据在于如下两点:

  • 可识别性。作为工业社会的产物,相同功能的基础设施外形表现大同小异,这使我们能够分辨「这是什么」。确定如港口、机场、体育场等大型设施对确定位置会起到关键作用。
  • 地域差异性。受到国家和地区政策、气候条件、经济地理条件的影响,基础设施彼此之间也会存在差异。这使我们能够推测「这在哪里」。

简要列举一些常用的基础设施信息:

  1. 地标建筑:地标建筑一般具备一定的独特性,可以借助以图搜图定位到城市。若是山寨模仿者,利用新闻报道也不难找到。
  2. 城区:中心城区、城中村、城乡结合部的天际线和鸟瞰图各有差异,城市规模的大小也会影响到这些城市景观。
  3. 房屋:房屋一般坐北朝南,可用于判别方向。各地农村民房具有不同风格,如红瓦尖顶、粉墙黛瓦、窑洞、四合院等,可推测所在地区。
  4. 道路:不同类型的铁路、公路各有其特殊设施,如铁路接触网、护坡、隔离网等。铁路车站、公路收费站、立交桥、交通标志等也是重要线索。风格独特的路灯也有可能成为解谜的突破口。
  5. 车辆:车牌可帮助推测所在国家,有的还可进一步精确到一级行政区。如果汽车靠左行驶,则可排除掉规定汽车靠右行驶的国家,反之亦然。城市公交车、出租车通常采用统一或成系列涂装。
  6. 列车、飞机:根据列车、飞机的外形细节可确定其型号。列车、飞机的班次均可在网上查询。特殊涂装也能透露重要信息。根据飞机上照片的拍摄角度,可大致判断飞机是否处于起飞或降落状态。
  7. 特殊设施:气象站、雷达站、体育场、港口码头等地常有特殊设施,如体育场专用照明灯、码头龙门吊等。识别这些特殊设施具备相关知识背景。

基础设施信息是网络迷踪中最常见、最主要的信息种类,本文无法面面俱到,只能蜻蜓点水。这里我们介绍一个典型的根据基础设施信息判定位置的案例,它来自开源信息专家 NixIntel 的博客 。这位专家的博客为国内的网络迷踪博主提供了丰富素材。

第二道谜题图片,图自 Swapfiets 公司

这是一张 Swapfiets 公司发布的广告照片,需要寻找照片的位置。NixIntel 从图中提取出如下信息:

  • 这是一座拥有高楼的城市。
  • 道路上的轨道表明该城市运营有轨电车。
  • 能够看到部分车牌,格式为 PJ-620-*。
  • 灯柱上有黑白色条纹。
  • 道路左侧建筑有显眼的修长白色柱子。

NixIntel 访问了该公司官网,得知彼时该公司在荷兰、德国、丹麦、比利时四个国家运营。具体在哪个国家,可以用车牌判定。WorldLisencePlates 网站收录了全球各国的车牌样式,上述四国样式如下:

四国车牌比较。图自 WorldLisencePlates

比对下来,荷兰车牌的样式最为接近,下一步就先搜索荷兰好了。如果不是荷兰也没太大关系,我们退回来重新选择即可。

选定了国家,有没有办法细化到省区或市呢?回顾刚刚的线索,有轨电车似乎不错,毕竟不是所有城市都有。查询 维基百科的荷兰有轨电车页面 可知,荷兰目前只有五个城市尚在运营有轨电车:代尔夫特、乌德勒支、鹿特丹、阿姆斯特丹和海牙。

荷兰有轨电车词条,图自 维基百科

大白柱子的建筑此时派上用场,它大概率就在这五个城市之中。Phrio 网站收录了世界各地的大型建筑,可按城市筛选,并配有图片。代尔夫特的页面如下:

Phrio 网站代尔夫特页面。图自 NixIntel 博客,发稿时该网站尚在维护中

代尔夫特没有发现明显匹配的建筑,它的建筑体量普遍没有广告照片中那么大。乌德勒支有几座更大的商业建筑,但依然没有符合的。鹿特丹、阿姆斯特丹和海牙的规模要大得多,答案很有可能在它们之中。大规模城市必然有大量高层建筑,这是鹿特丹的大楼们:

鹿特丹高层建筑一览。图源同上

浏览过后可以发现一栋熟悉的建筑,高挑的白色柱子非常显眼。它叫做联合利华大厦:

联合利华大厦。图源同上

进入街景,熟悉的黑白电线杆、电车轨道和路面,确认拍摄地就在这里。

鹿特丹街景。图源谷歌地球

这个案例很好地体现了互联网开源信息的强大之处。在没有用到专业知识的情况下,我们仅提取了几个信息点,就可以利用互联网的多样化展开探索,得出答案。这是网络时代赋予我们每个人的超能力。

自然地理信息

常见的自然地理信息有光影、天气、地形地貌、植物等。提取解读自然地理信息需要博物君般广博深厚的自然地理知识积累,以及在此基础上的直觉。在很多著名网络迷踪案例中,关键步骤只是大佬的一句「我感觉像这个地区」,其中奥妙不可言传。

常用的自然地理信息有:

  1. 地形地貌:水域〔河流湖泊水库海洋〕、山脉〔积雪〕、土壤颜色等。
  2. 植物:植物通常有一定的分布区域,当目标范围不明确时,可以用植物信息辅助排除。但因为广泛的物种引进,这一排除并不十分可靠。
  3. 光影:从影子可以得出大致方向,进而判断行进方向或道路方向。Suncalc 网站可帮助确定影长、位置或时间。图片中通常不难看出是白天还是黑夜,这有助于排除一部分不符合图片日夜状态的班次。
  4. 天气:天气是常见的辅助信息之一。根据所在地历史天气变化情况,可以推知拍摄的日期范围。
  5. 人物:姑且算作地理信息吧。根据图片中的人种,可以猜测图片拍摄地。

本节以炒饭社区的 一个帖子 为例。本题是由炒饭社区两位大佬 鞍山吴彦祖 〔下称「猫佬」〕合作解出的。题面图片如下,询问拍摄者位置。

第三道谜题图片。图自 炒饭社区

鞍山吴彦祖对这张图片的判断是:

根据天气及山形植被,可以判断应该是北京以北〔包括东北三省及内蒙部分地区〕。

根据远处房屋红瓦尖顶,且门前有类似于玉米农作物,基本可以确定是在东北地区。

这个判断过程更多是基于经验,但东北地区这一范围仍然较大。这也是依据自然地理信息推断的特点:需要丰富的经验知识,但又不能把范围缩到很小的区域。

猫佬进一步给出了两点判断:

左侧铁路有路灯和站名牌,推断拍摄位置位于铁路车站附近。

远外民房应该是南北向的,再加上北向归线以北的影子不可能在南边,所以推测方位如下:

左侧铁路大致南北走向,上穿铁路大致东西偏南走向,交叉点距离车站 500 米以内。

至此,图片中的信息已经提取完毕。靠人力搜索东北地区的所有铁路交叉点虽然可行,但时间成本过高且难免疏漏。有没有工具能够代替人类做这件事呢?有的!隆重介绍在开源调查领域具有划时代意义的搜索工具:Overpass Turbo 。这是 OpenStreetMap 基于 Web 的数据挖掘工具。简而言之,它是一个地图搜索引擎,能根据用户指定的位置关系搜索所有符合条件的地点。在国内它收录的兴趣点较少,但铁路相关信息还比较完整。

别激动地太早,下面这个消息可能会令人望而却步——使用它需要学习代码。Overpass Turbo 使用一套被称作 Overpass API 的查询语句。

本例中我们使用的核心代码如下,由猫佬给出。我尝试了引入高铁条件缩小范围,但发现 maxspeed 字段存在缺失,于是此处沿用原代码。限于篇幅,仅给出简要注释说明,感兴趣的读者可以自行搜索教程学习。

https:// 搜索区域内长度大于 1 公里的铁路桥,存储于 w1
way[railway = rail][bridge](if: length() > 1000)({{bbox}}) -> .w1;
https:// 搜索与 w1 交叉〔距离为 0〕,长度大于 1 公里,非铁路桥铁路,存储于 w2
way(around.w1: 0)[railway = rail][!bridge](if: length() > 1000) -> .w2;
https:// 给出所有在 w1 附近 500 米内、w2 附近 20 米内的铁路车站
node(around.w1: 500)(around.w2: 20)[railway = station];

东北地区范围较大,可以分两三次搜索。结果如下,圆圈标记表示命中:

Overpass Turbo 搜索结果。图自炒饭社区

根据前文分析的铁路走向,可以筛选出一个符合条件的车站:塔黄旗车站。

塔黄旗车站。图自炒饭社区、高德地图

这个案例并非纯粹依靠自然地理信息,但据此判断所在地区大幅减少了搜索工作量。借助 Overpass Turbo,快速大范围排查成为可能。

场外信息

当图片中的信息不足以判断出位置时,侦探们不得不获取场外提示了。以下各项若涉及到隐私和法律问题,请务必在出题者或当事人同意,或官方部门授权的情况下使用。

  1. 图片 EXIF 信息:如果出题者发布了原始图片,且网络平台未抹除 EXIF 信息,则可通过此信息直接定位到拍摄地。
  2. 出题者历史记录:查看出题者在公共社交平台上发布过的内容,包括个人主页和评论。有人会在不同公共社交平台使用相同头像或用户名、发布相似内容,这样很容易跨平台搜索到。
  3. 社交网络关系:出题者的好友网络也有可能暴露其本身。与他频繁互动的好友可能有相同生活经历、相同兴趣或属于相同组织,而好友发布的内容也很可能与其本人相关。

再也不敢在网上发东西了?

网络迷踪经常受到隐私方面的质疑。为了避免公众疑虑,炒饭社区和推特上的 @Quiztime 均以出题人发布本人拍摄照片为主。但是,难免有心怀不轨者偷偷摸摸针对个人展开调查。因此,大家发布内容时应该多个心眼,假设自己的所有图片都有可能暴露拍摄位置。

  • 发布平台是公开平台吗?查看我在该平台发布的内容前,是否需要加我好友或经我同意?发布人人皆可访问的信息需要十分谨慎。
  • 如果图片拍摄地得知,会涉及到核心隐私吗?展示自己去过的景点、公共场所其实影响不大;但倘若拍摄地与你及好友的居住地、工作地相关,则须确保图片中不含上文介绍的可以展开调查的信息,文案也不涉及到对通勤、交通的描述。
  • 避免发布国家安全相关图片,例如武器、军队等。

注意到以上几点,基本就不会像王珞丹那样被偷家了。

假如图片不涉及到核心隐私,但你也不希望被调查到拍摄位置,则须注意:

  • 避免发布同一地点的多张图片,这很有可能为开源调查提供充足信息。
  • 避免发布含有较多文字信息的图片。
  • 避免发布含有特殊基础设施信息和自然地理信息的图片。
  • 避免发布原图。

相信经过本文的介绍,各位读者已经了解了网络迷踪的基本玩法,能够分析出一张图片中含有的重要线索。现在,打开自己的微博和朋友圈,你也可以分析哪些图片会暴露自身位置,进而成为自己的网络内容安全专家。

我想学

在恪守隐私安全的前提下,网络迷踪不失为有益的解谜游戏。它能够扩展玩家知识面,增进对现实和网络的了解,锻炼推理能力和自主获取信息能力。

本文侧重于提取图片信息的介绍,网络资源只是顺带提及。因为在我看来,知道哪些信息可以搜索比如何搜索更重要,也是大部分人参与网络迷踪的最大障碍——无法意识到图片中存在着关键信息。在突破这一难关后,你可以借助以图搜图获取进一步信息,或者到专门介绍这类信息的网站上筛选。假如不知道有什么网站,你还可以搜索或者到专门的论坛上提问,这都是可以慢慢积累经验解决的问题。

有哪些论坛可以交流?有哪些大神的博客可以访问?有哪些资源可以为我提供帮助?这些是留给你的网络迷踪题:前面我已经给出了很多提示,现在是锻炼自主获取信息能力的时候了。

祝你的网络探索之旅顺利!


Like it? Share with your friends!

0
DUN

Choose A Format
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Video
Youtube and Vimeo Embeds