iPad 编程指日可待 – 用 Google Colab 练 Python

6 min


这个学期,我在北得克萨斯大学(University of North Texas)教「INFO 5731: Computational Methods for Information Systems」课程,主要内容包括: Python 基础、自然语言处理,以及机器学习。

授课的对象是信息科学、数据科学专业的硕士与博士研究生。跟在国内一样,我依然使用翻转教学(flipped instruction)方式。过去的几周,我们把「Python 基础」部分学完了。每周,我都会要求学生在课前阅读两本教材上的指定章节,然后把所有的代码自己重复一遍。在此基础上,对每一段代码,学生都要自己试着进行一些改动。出错也没有关系,尝试解决。

因为绝大部分学生,都是 Python 初学者。因此他们都会遇到以下的实际问题:

  • 不知道如何安装和设置运行环境;
  • 遇到问题会慌乱,不知如何有效寻找解决方法;
  • 对于团队作业,不知该如何有效协作;
  • 不懂得如何进行版本控制,代码越改越乱。

这些问题,也构成了学生的痛点。如果不能有效加以解决,学生会把每周宝贵的学习时间,浪费到许多琐碎的无用功上。更可能的情况,是他们的信心会被打击,导致丧失学习的动力和兴趣

因此,我为他们找到了一款合适的 Python 练习工具。这里,我把这款工具也分享给你。

这款工具,就是 Google Colab 。我曾经在《如何免费云端运行 Python 深度学习框架?》一文中为你介绍过它,在《如何用 Python 和循环神经网络做中文文本分类?》和《如何用 Python 和循环神经网络预测严重交通拥堵?》里,我也曾用它给你做过代码的展示。

下面,我给你们介绍一下如何用 Google Colab 应对上述的 4 个痛点,为你的 Python 练习提供辅助。

环境

新手最常见的问题,就是好不容易累积了学习的兴趣,上手不久便遇到报错。而 Python 新手遇到的许多错误,实际上都和环境的配置有关。例如说,Anaconda 套件下载环节,你就不知道该选择哪个版本。

2019-02-25-081846

好不容易安装好了,因为路径设置问题,连 Jupyter Notebook 都呼叫不出来。终于能输入代码了。结果一输入就提示,你要调用的模块名称,没听说过!

2019-02-25-081936

而这些,Google Colab 都帮你处理好了。只需要打开一个浏览器(推荐 Google Chrome 或者 Firefox),输入:https://colab.research.google.com 就可以看到以下页面。

2019-02-25-082031

选择新建 Python 3 笔记本,然后就能看到完全配置好的 Python 运行环境了。

2019-02-25-082107

对,就是这么简单。你可别小瞧这个运行环境,虽然你没有执行任何安装过程,但是它基本上涵盖了你做数据科学分析,要用到的各种工具,这些工具包括但不限于 Numpy、Scipy、Pandas 等,甚至连深度学习的框架,例如 Tensorflow、Keras 和 Pytorch,也是一应俱全。

2019-02-25-082159

Google Colab 的深度学习环境支持,可不只是软件那么简单。Google 慷慨的提供了 GPU, 甚至是更专业化的 TPU, 供你免费使用。

2019-02-25-082308

默认状态,这些云端硬件是不开启的。你需要在菜单栏中选择 runtime,然后选择 Change runtime type,就可以看到不同硬件支持的选项了。

2019-02-25-63ff8ee0029cb9f490fd91caf9749938

有的书籍样例代码,甚至是 Python 组件,都需要 Python 2 环境才能运行,这也没关系。点击新建笔记本,你就能使用不同的 Python 版本了。

2019-02-25-082747

细心的你会发现,在上面的「修改运行时设置」页面里,也可以随时调整 Python 版本。

求助

作为新手,你遇到错误和问题,是完全正常的。而 Python 具有强大的社区,可以给你提供很多帮助。

3289777a0079556b8995a58c40ce1d91

但如果你尝试过,便可能有一种错觉——这些 Python 高手很不友好。因为你贴了问题,却没人理你。其实,这很可能是你问问题的方式不对。想想看,你笼统地说一个报错信息,可能的原因或许有数十甚至上百种,谁能帮你一一排除?这倒也罢了。可是你明明贴了一段代码,还给出了错误信息的截图啊。为什么还是没有人伸出援手?因为这些信息,可能依然不够。

想想看,你本地安装了什么样的套件?其中的各种模块,都分别是什么版本?你执行当前代码有问题,那上下文是什么?会不会是因为之前某个代码段落,影响了你当前段落的执行?你的操作系统,是否完全支持你正在使用的组件功能……这些可能性,无穷无尽。同样,也没有人这样花时间帮你枚举。

但是有了 Google Colab ,你提问的效果却可以大大提升。因为,你可以用最简单的方法,让潜在的回答者复现你的问题。这就是,把你的笔记本共享出去。如下图,点击笔记本右上角的 Share 按钮。

2019-02-25-085300

在出现的对话框里,注意选择权限。选成可以浏览(view),就可以了。

b4f67c719a8122983009a1a511f211d9

然后,选择「复制链接」,链接就到了你的剪切板里面了。把它连同你的文字描述,直接贴到 Python 的论坛或者课程讨论区里。别人只需要点击,就能查看你的全部代码、报错信息。而且,还能运行你的笔记副本。注意,虽然你俩可能用的是不同的操作系统、不同的浏览器,但因为都用了 Google Colab ,你们的 Python 环境是完全一致的。等到对方解决了问题,他还可以把完整的笔记本再用链接方式分享给你。你的问题于是迎刃而解。

63a4ca55f79bfb4f25e425978990b152

问问题,只是寻求帮助的一个方面。在提问之前,你还是应该自己尝试一下解决的。毫不愿意思考,直接当伸手党,社区里的人很难喜欢跟你打交道。而 Google Colab 为你主动寻找问题答案提供了工具支持。每当你遇到报错的时候,你都会看到下方有个按钮。

2019-02-25-085610

点击这个按钮, Google Colab 就会用搜索引擎,在 Stackoverflow 这个 IT 问答站点上,帮你寻找相关报错的已有答案。

2019-02-25-085636

一般来说,点击前几条信息,你就会有收获。例如这次,你就很幸运,因为答案明确说明,这是因为 Python 版本带来的差异。你只需要根据提示,进行代码的轻微调整,就能正常运行了。

a10864e039e523728a77e7588fdcd255

协作

不知你有没有尝试过跟人协作编写代码?我的课上,是有小组作业的。要求学生 2 – 3 人一组,一起用 Python 解决问题。有的人,是这样协作的:自己写一段代码,用邮件传给对方;对方改完,发回来;自己在上面修改添加,再发回去……

这样显然效率很低。有没有高效的方法?当然有。依然利用我们刚才已经见到过的共享功能。

2019-02-25-085940

只是这一次,在选择权限的时候,给对方「可修改」权限

2019-02-25-090012

例如还是刚才的 print 命令没有加括号的问题。只不过这次,对方除了能看到你的问题,还可以直接编辑。你的协作者,新建了一个代码块,并且输入了正确的信息。

6cb86f17c8380707b31d40698c47f9b8

在你这里看起来,就是这个样子的。协作者的头像,会显示在对应的修改内容旁边。这样一目了然。

c93a60ec71c40bff4332d17b6c0a2c19

对方还可以在代码块旁,选择添加注释。

edba31730d7c4d3dd6131aee38ee5336

例如输入以下内容。

a121f9a0bba618873cf67961eb8c98f3

你可以同步在自己的笔记本上,看到对方的注释。

a5f52fd4dfd47170d8de80d52f51e80d

这样一来,团队协作 Python 练习沟通的效率,自然就高了许多。

注意,为了安全起见,一定只能把该权限,限定在你信任的协作者中。

如果是打算把你的成果展示出来,你可以使用 Google Colab 与 Github 的集成功能。如下图,选择保存副本到 Github

e12b1733471e49407a5f640644f113ca

然后,选择你希望保存到的 Github 项目。

53c6d9830931bb44b3be6d8581a33d8e

保存完毕后,对应的 Github 页面会自动打开,供你预览。其中可以包含全部的文字、图片、代码和输出信息。注意笔记本的顶部,有一个「在 Colab 打开」的链接。

3bdf06432cf07fdf914ce889301c71f9

点击它,你就能迅速开启 Google Colab 环境,并且直接运行这个 Github 上的笔记副本。

3ddf649508317e2e239332b27bbe16d1

版本

当你不停地尝试和改动代码的时候,很有可能会把问题改得更加糟糕。这时候,你恨不得有一个时光机,可以让你回到错误少一点的时候。这个时光机,Google Colab 是提供了的。

f1736fcd8783afccba4560844c706ede

点击菜单里面的 Revision history 功能,你就能看到当前笔记本已保存的全部历史版本,包括修改时间、谁改的、文件大小等各种信息,一应俱全,想回到哪个版本,点一下「恢复」按钮就可以了。

7f35b09f65dec8f42024e6d7bedde27b

另外,你也可以把 Google Colab 笔记本,直接下载成为 ipynb 文件,在本地保存副本。

c945b35f55f12194b018e53dace12eff

一定要注意选择需要的存储路径,避免不知存到哪里去了。

3b886b47daaed4d3d67e52ec2ff8d558

我一般让学生交作业的时候,都需要同时提交 Google Colab 链接,以及一个 ipynb 文件。二者的内容,应该是一样的。既然如此,为什么还需要提交两样东西呢?这个问题,作为思考题,留给你。请注意联系本节标题,加以分析。

有了 ipynb 文件,你可以用本地的 Jupyter Notebook 开启。但是如果你只是想查看内容的话,这里给你推荐一个更好的工具,叫做 nteract 。它可以帮你直接开启 ipynb 文件,用于查看。这样,你就没必要每次都用 Jupyter Notebook 命令开启后台服务,然后再到浏览器中点开对应的 ipynb 了。

550ed845e82f96e38004c4fb2462bd14

小结

本文给你推荐的 Google Colab ,可以帮你解决 Python 初学者练习实践 Python 编程时,最常遇到的几大痛点。包括:

  • 自动配置
  • 有效求助
  • 协作编程
  • 版本控制

这样一来,你可以把宝贵的时间,聚焦在技能的掌握和应用;而不是久病成医,成为「环境配置专家」了。

祝 Python 编程学习愉快!


Like it? Share with your friends!

0
DUN

Choose A Format
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Video
Youtube and Vimeo Embeds