2011 年,一则名为《我是如何推理出王珞丹住址的?》的帖子被疯狂转载。帖子作者凭借王珞丹几条微博、自己对北京城的了解和 Google Earth,用时四十多分钟就推理出了王珞丹前住址。〔王珞丹是彼时大火的职场剧集《杜拉拉升职记》主演,当红女明星,暴露年龄的作者注。〕GGMM 们在惊呼「碉堡了」之余,不免担心自己也会被调查一番,纷纷表示再也不敢在网上发东西了。
十年后的 2021 年,在众多爱好者和创作者的引介下,一种被称为「网络迷踪」的侦探游戏进入大众视野:在只有一张图片和寥寥提示的条件下,大神们仅凭一台联网的电脑,足不出户即可找到图片拍摄地,有的甚至能确定拍摄时间。如今的网友们在惊呼「卧槽牛批」之余,不免担心自己也会被调查一番,纷纷表示再也不敢在网上发东西了。
互联网的历史是「毅种循环」,但循环是螺旋上升的。十年间全球网民数量翻倍,网页数量翻了两番,虽然我们都没什么长进,但这种调查技术已在海量互联网信息加持下日趋成熟。它的正式名字叫做开源调查〔Open Source Investigations, OSI〕或开源情报〔Open Source Intelligence, OSINT〕,指利用互联网上的开源信息展开调查的技术。
「网络迷踪」是开源调查最具影响力的一种形式,因为它看上去极具戏剧性:一张图片就能准确定位。但这种戏剧性源于人们低估了一张图片所能包含的信息量,以及互联网开源信息的规模和广度。你是否担心自己的照片会暴露隐私?你是否好奇侦探们如何抽丝剥茧得出拍摄者的位置?今天,经过这篇文章的介绍,你也可以揭开网络迷踪的神秘面纱,成为一名网络侦探,成为自己的网络内容安全专家。
网络迷踪的玩法
炒饭社区是一个类似于贴吧的兴趣聚合社交网站,其 网络迷踪版块 在圈内极有影响力。每天,很多饭友在此处发布自己拍摄的照片,向「侦探们」发出挑战。版主团队定期举办网络迷踪积分赛,得胜还有精美奖杯相送。〔非广告,特此声明。尚未注册的作者注。〕
并不是所有图片都适合成为一道谜题。在炒饭社区,谜题图片集中在城市建筑、交通工具〔尤其是飞机高铁〕、道路、景点等几类内容上,且以远景为主。如果拍一张自己桌上的摆件,或者路边小花小草,侦探们是很难从图片内容中获得有效信息的。
网络迷踪的基本思路可分为如下三步:
- 提取:仔细观察图片,提取其中所有有效信息。无论它多么细小和模糊,都不能放过;
- 分析:利用自身知识储备和互联网工具分析所得信息,缩小排查范围;
- 验证:运用互联网工具展开排查,直至搜索完分析阶段获得的排查范围。如果未能成功找到,返回前两步再试。
提取和分析信息是网络迷踪的关键,也是其乐趣所在。这有赖于侦探们广博的知识面、强大的互联网信息检索能力和长期的经验积累。
网络迷踪侦探更倾向于通过逻辑推理而非暴力破解得出答案,推理过程越难,得出答案的成就感越强。考虑到现实的复杂性,这一推理过程并不严格,更多是基于生活经验的大概率推测。
图片中隐藏着什么?
要成为合格的网络迷踪侦探,第一步就是会看图,能够挖掘出图片中的隐藏信息。笼统地说,一张图片可以包含以下几方面信息:文字信息、基础设施信息、自然地理信息。
文字信息
文字信息是推测地理位置最快速简单的方式。相比其他种类信息,文字信息优势巨大:
- 可能直接透露位置:路牌、政府机关大楼、车站站名、门牌号等文字信息都与地理位置强关联,很容易成为送分题。
- 没有专业门槛:你可能需要一定的专业知识和比对分析过程才能确定植物的品种、飞机的型号,而解读文字信息完全不需要这些,能认字即可。
- 便于搜索:你可以直接在搜索引擎里搜索文字。虽然很多搜索引擎支持以图搜图,但其准确性尚不能与文字相比。
因此,网络迷踪侦探不会放过图中任何文字信息,即使它模糊不清也要辨识一番。
例如,给出下面一张图片,询问拍摄者位置:
这是一家沙县小吃店。但直接搜索沙县小吃并不是个好主意——全国沙县小吃店数以万计。仔细观察图片细节,可以发现多处文字信息:隔壁「* 记」,门窗倒影上有「王府」、「旺基」,门牌号「香榭 *」、「23*」,电动车挡泥皮上「星桥莫拉克专卖店」的广告。
电动车很少跨城市,因此可以通过其牌照和挡泥板广告推断拍摄地所在城市。牌照上城市字样模糊不清,只能看出是两个字,于是从挡泥皮入手。
在全国范围搜索「星桥」,排除「三星大桥」之类的模糊匹配项,剩余可能项有 12 个:浙江省杭州市星桥街道、湖州市星桥村,福建省三明市星桥村、福清市星桥村,四川省资阳市星桥村、广安市星桥村、广元市星桥村,重庆市星桥镇,云南省丽江市星桥村,湖南省邵阳市星桥村、株洲市星桥村,湖北省咸宁市星桥村。从门窗倒影来看,此地商业活动密集,并不像是普通农村。
广告上还提供了「莫拉克专卖店」的手机号。众所周知,我国手机号前三位代表运营商,中间四位为地区编码,所以手机号前七位足以确定号码归属地。这未必一定是拍摄者所在地,但大概率是真的。
手机号比较模糊,前七位中能够看清的数字是「1508*64」,第五位像 3、5 或 8。查询可知,1508364 属江西新余,1508564 属贵州遵义,1508864 属浙江杭州。比对星桥的搜索结果,只有杭州市重合。因此,可以暂且假定拍摄者位于杭州,展开下一步搜索。
接下来注意到门牌号「香榭 *」、「23*」。门牌的内容有可能是道路名、小区名、村镇名。考虑到附近商业密集,此处较大可能是道路名。「香榭」后内容被遮挡,从比例位置来看尚余一字,应该是「路」、「街」之类。
在杭州市搜索「香榭路」,果然找到一条名为香榭的道路,属星桥街道。
在该区域搜索沙县小吃,找到一家「疑似目标」:
可惜街景较旧,没有找到与图片类似的店面。但建筑风格和路牌格式均相符。
在美团上能够找到这家店铺,门牌号为「香榭路 23-1 号」,店面图片与谜题图片一致。至此,确定拍摄者位置在浙江省杭州市临平区香榭路 23-1 号沙县小吃门口附近。
以上便是一道网络迷踪 送分题,因为仅需分析文字信息即可得出答案。
基础设施信息
大到城区,小到垃圾桶,基础设施包罗万象,涵盖市政、交通、建筑等领域。根据基础设施展开网络迷踪,理论依据在于如下两点:
- 可识别性。作为工业社会的产物,相同功能的基础设施外形表现大同小异,这使我们能够分辨「这是什么」。确定如港口、机场、体育场等大型设施对确定位置会起到关键作用。
- 地域差异性。受到国家和地区政策、气候条件、经济地理条件的影响,基础设施彼此之间也会存在差异。这使我们能够推测「这在哪里」。
简要列举一些常用的基础设施信息:
- 地标建筑:地标建筑一般具备一定的独特性,可以借助以图搜图定位到城市。若是山寨模仿者,利用新闻报道也不难找到。
- 城区:中心城区、城中村、城乡结合部的天际线和鸟瞰图各有差异,城市规模的大小也会影响到这些城市景观。
- 房屋:房屋一般坐北朝南,可用于判别方向。各地农村民房具有不同风格,如红瓦尖顶、粉墙黛瓦、窑洞、四合院等,可推测所在地区。
- 道路:不同类型的铁路、公路各有其特殊设施,如铁路接触网、护坡、隔离网等。铁路车站、公路收费站、立交桥、交通标志等也是重要线索。风格独特的路灯也有可能成为解谜的突破口。
- 车辆:车牌可帮助推测所在国家,有的还可进一步精确到一级行政区。如果汽车靠左行驶,则可排除掉规定汽车靠右行驶的国家,反之亦然。城市公交车、出租车通常采用统一或成系列涂装。
- 列车、飞机:根据列车、飞机的外形细节可确定其型号。列车、飞机的班次均可在网上查询。特殊涂装也能透露重要信息。根据飞机上照片的拍摄角度,可大致判断飞机是否处于起飞或降落状态。
- 特殊设施:气象站、雷达站、体育场、港口码头等地常有特殊设施,如体育场专用照明灯、码头龙门吊等。识别这些特殊设施具备相关知识背景。
基础设施信息是网络迷踪中最常见、最主要的信息种类,本文无法面面俱到,只能蜻蜓点水。这里我们介绍一个典型的根据基础设施信息判定位置的案例,它来自开源信息专家 NixIntel 的博客 。这位专家的博客为国内的网络迷踪博主提供了丰富素材。
这是一张 Swapfiets 公司发布的广告照片,需要寻找照片的位置。NixIntel 从图中提取出如下信息:
- 这是一座拥有高楼的城市。
- 道路上的轨道表明该城市运营有轨电车。
- 能够看到部分车牌,格式为 PJ-620-*。
- 灯柱上有黑白色条纹。
- 道路左侧建筑有显眼的修长白色柱子。
NixIntel 访问了该公司官网,得知彼时该公司在荷兰、德国、丹麦、比利时四个国家运营。具体在哪个国家,可以用车牌判定。WorldLisencePlates 网站收录了全球各国的车牌样式,上述四国样式如下:
比对下来,荷兰车牌的样式最为接近,下一步就先搜索荷兰好了。如果不是荷兰也没太大关系,我们退回来重新选择即可。
选定了国家,有没有办法细化到省区或市呢?回顾刚刚的线索,有轨电车似乎不错,毕竟不是所有城市都有。查询 维基百科的荷兰有轨电车页面 可知,荷兰目前只有五个城市尚在运营有轨电车:代尔夫特、乌德勒支、鹿特丹、阿姆斯特丹和海牙。
大白柱子的建筑此时派上用场,它大概率就在这五个城市之中。Phrio 网站收录了世界各地的大型建筑,可按城市筛选,并配有图片。代尔夫特的页面如下:
代尔夫特没有发现明显匹配的建筑,它的建筑体量普遍没有广告照片中那么大。乌德勒支有几座更大的商业建筑,但依然没有符合的。鹿特丹、阿姆斯特丹和海牙的规模要大得多,答案很有可能在它们之中。大规模城市必然有大量高层建筑,这是鹿特丹的大楼们:
浏览过后可以发现一栋熟悉的建筑,高挑的白色柱子非常显眼。它叫做联合利华大厦:
进入街景,熟悉的黑白电线杆、电车轨道和路面,确认拍摄地就在这里。
这个案例很好地体现了互联网开源信息的强大之处。在没有用到专业知识的情况下,我们仅提取了几个信息点,就可以利用互联网的多样化资源展开探索,得出答案。这是网络时代赋予我们每个人的超能力。
自然地理信息
常见的自然地理信息有光影、天气、地形地貌、植物等。提取解读自然地理信息需要博物君般广博深厚的自然地理知识积累,以及在此基础上的直觉。在很多著名网络迷踪案例中,关键步骤只是大佬的一句「我感觉像这个地区」,其中奥妙不可言传。
常用的自然地理信息有:
- 地形地貌:水域〔河流湖泊水库海洋〕、山脉〔积雪〕、土壤颜色等。
- 植物:植物通常有一定的分布区域,当目标范围不明确时,可以用植物信息辅助排除。但因为广泛的物种引进,这一排除并不十分可靠。
- 光影:从影子可以得出大致方向,进而判断行进方向或道路方向。Suncalc 网站可帮助确定影长、位置或时间。图片中通常不难看出是白天还是黑夜,这有助于排除一部分不符合图片日夜状态的班次。
- 天气:天气是常见的辅助信息之一。根据所在地历史天气变化情况,可以推知拍摄的日期范围。
- 人物:姑且算作地理信息吧。根据图片中的人种,可以猜测图片拍摄地。
本节以炒饭社区的 一个帖子 为例。本题是由炒饭社区两位大佬 鞍山吴彦祖 和 猫〔下称「猫佬」〕合作解出的。题面图片如下,询问拍摄者位置。
鞍山吴彦祖对这张图片的判断是:
根据天气及山形植被,可以判断应该是北京以北〔包括东北三省及内蒙部分地区〕。
根据远处房屋红瓦尖顶,且门前有类似于玉米农作物,基本可以确定是在东北地区。
这个判断过程更多是基于经验,但东北地区这一范围仍然较大。这也是依据自然地理信息推断的特点:需要丰富的经验知识,但又不能把范围缩到很小的区域。
猫佬进一步给出了两点判断:
左侧铁路有路灯和站名牌,推断拍摄位置位于铁路车站附近。
远外民房应该是南北向的,再加上北向归线以北的影子不可能在南边,所以推测方位如下:
左侧铁路大致南北走向,上穿铁路大致东西偏南走向,交叉点距离车站 500 米以内。
至此,图片中的信息已经提取完毕。靠人力搜索东北地区的所有铁路交叉点虽然可行,但时间成本过高且难免疏漏。有没有工具能够代替人类做这件事呢?有的!隆重介绍在开源调查领域具有划时代意义的搜索工具:Overpass Turbo 。这是 OpenStreetMap 基于 Web 的数据挖掘工具。简而言之,它是一个地图搜索引擎,能根据用户指定的位置关系搜索所有符合条件的地点。在国内它收录的兴趣点较少,但铁路相关信息还比较完整。
别激动地太早,下面这个消息可能会令人望而却步——使用它需要学习代码。Overpass Turbo 使用一套被称作 Overpass API 的查询语句。
本例中我们使用的核心代码如下,由猫佬给出。我尝试了引入高铁条件缩小范围,但发现 maxspeed 字段存在缺失,于是此处沿用原代码。限于篇幅,仅给出简要注释说明,感兴趣的读者可以自行搜索教程学习。
https:// 搜索区域内长度大于 1 公里的铁路桥,存储于 w1
way[railway = rail][bridge](if: length() > 1000)({{bbox}}) -> .w1;
https:// 搜索与 w1 交叉〔距离为 0〕,长度大于 1 公里,非铁路桥铁路,存储于 w2
way(around.w1: 0)[railway = rail][!bridge](if: length() > 1000) -> .w2;
https:// 给出所有在 w1 附近 500 米内、w2 附近 20 米内的铁路车站
node(around.w1: 500)(around.w2: 20)[railway = station];
东北地区范围较大,可以分两三次搜索。结果如下,圆圈标记表示命中:
根据前文分析的铁路走向,可以筛选出一个符合条件的车站:塔黄旗车站。
这个案例并非纯粹依靠自然地理信息,但据此判断所在地区大幅减少了搜索工作量。借助 Overpass Turbo,快速大范围排查成为可能。
场外信息
当图片中的信息不足以判断出位置时,侦探们不得不获取场外提示了。以下各项若涉及到隐私和法律问题,请务必在出题者或当事人同意,或官方部门授权的情况下使用。
- 图片 EXIF 信息:如果出题者发布了原始图片,且网络平台未抹除 EXIF 信息,则可通过此信息直接定位到拍摄地。
- 出题者历史记录:查看出题者在公共社交平台上发布过的内容,包括个人主页和评论。有人会在不同公共社交平台使用相同头像或用户名、发布相似内容,这样很容易跨平台搜索到。
- 社交网络关系:出题者的好友网络也有可能暴露其本身。与他频繁互动的好友可能有相同生活经历、相同兴趣或属于相同组织,而好友发布的内容也很可能与其本人相关。
再也不敢在网上发东西了?
网络迷踪经常受到隐私方面的质疑。为了避免公众疑虑,炒饭社区和推特上的 @Quiztime 均以出题人发布本人拍摄照片为主。但是,难免有心怀不轨者偷偷摸摸针对个人展开调查。因此,大家发布内容时应该多个心眼,假设自己的所有图片都有可能暴露拍摄位置。
- 发布平台是公开平台吗?查看我在该平台发布的内容前,是否需要加我好友或经我同意?发布人人皆可访问的信息需要十分谨慎。
- 如果图片拍摄地得知,会涉及到核心隐私吗?展示自己去过的景点、公共场所其实影响不大;但倘若拍摄地与你及好友的居住地、工作地相关,则须确保图片中不含上文介绍的可以展开调查的信息,文案也不涉及到对通勤、交通的描述。
- 避免发布国家安全相关图片,例如武器、军队等。
注意到以上几点,基本就不会像王珞丹那样被偷家了。
假如图片不涉及到核心隐私,但你也不希望被调查到拍摄位置,则须注意:
- 避免发布同一地点的多张图片,这很有可能为开源调查提供充足信息。
- 避免发布含有较多文字信息的图片。
- 避免发布含有特殊基础设施信息和自然地理信息的图片。
- 避免发布原图。
相信经过本文的介绍,各位读者已经了解了网络迷踪的基本玩法,能够分析出一张图片中含有的重要线索。现在,打开自己的微博和朋友圈,你也可以分析哪些图片会暴露自身位置,进而成为自己的网络内容安全专家。
我想学
在恪守隐私安全的前提下,网络迷踪不失为有益的解谜游戏。它能够扩展玩家知识面,增进对现实和网络的了解,锻炼推理能力和自主获取信息能力。
本文侧重于提取图片信息的介绍,网络资源只是顺带提及。因为在我看来,知道哪些信息可以搜索比如何搜索更重要,也是大部分人参与网络迷踪的最大障碍——无法意识到图片中存在着关键信息。在突破这一难关后,你可以借助以图搜图获取进一步信息,或者到专门介绍这类信息的网站上筛选。假如不知道有什么网站,你还可以搜索或者到专门的论坛上提问,这都是可以慢慢积累经验解决的问题。
有哪些论坛可以交流?有哪些大神的博客可以访问?有哪些资源可以为我提供帮助?这些是留给你的网络迷踪题:前面我已经给出了很多提示,现在是锻炼自主获取信息能力的时候了。
祝你的网络探索之旅顺利!