「Good Tape」是一个自动帮你将音频转为文稿的在线工具,以往类似功能都会受限于语言和准确性,不过 Good Tape 是使用 openai 旗下 Whisper 技术,支持英文、中文、日文、韩文、德文、法文、丹麦文等超过 40 种语言!用户只需要将音频文件上传就能生成标记时间的文字格式或字幕文件〔.SRT 格式〕,还能设置文稿的时间间距。
Good Tape 背后是丹麦知名的数位报纸 Zetland,会建立这项服务的原因是他们厌倦了昂贵的音频文字转换服务,目前市面上大多数类似服务都只能在英文表现较好,但在其他语言表现不佳,通过 OpenAI Whisper 就能解决这个问题,为用户节省可观的时间。
虽然 Good Tape 最初立意是为记者打造的,它针对转录访谈录音进行最佳化,但也能用于运营、业务咨询、研究或是制作 YouTube 视频等各种行业,更重要的是确保用户上传资料的安全、隐私性,传输过程完全加密,资料不会离开欧盟范围〔受到 GDPR 保护〕,在没有注册的情况下文件会保存三天。
另一个用户可能会比较关注的问题是 Good Tape 免费吗?运作服务需要耗费成本,如果要保持服务持续维护需要创造收入,未来 Good Tape 将会在免费方案以外加入付费计划,以提供更高安全性、更快的转换速度及便利性〔可能就和 chatgpt 一样〕。
教程
Good Tape – Secure and automatic transcription
Good Tape is an automatic transcription service that makes it easy for journalists (and others) to turn audio recordings into text, regardless of language or sound quality. We save you time and effort so you can focus on what really matters.
在 Good Tape 网站后点击「Upload file」上传要转为文稿的音频文件,支持 MP3、M4A 等各种常见音频格式,接着从「Language」选择音频文件语言,如果没选择的话就会使用自动检测,还是选择预言会比较精确,支持中文、英文等超过三四十种常见常用语言。
输入 Email 后勾选同意使用条款,点击「Transcribe」就会开始进行上传。
需要一段时间上传音频文件,很有趣的是 Good Tape 还会给用户一些小知识。
上传后 Good Tape 需要一段时间进行处理,在完成前会询问用户是否要建立一个账号,当然你也可以将画面关掉,等待完成时会使用 Email 通知用户。
完成后 Good Tape 会将用户上传的音频文件转换为文字格式,而且还包含时间轴,看起来就跟自己手打的文稿一样!下方的下载区域里会有三种选项:包含时间戳的文字格式、没有时间戳的文字格式和字幕文件三种,点击就能直接下载保存。
默认是以每 15 秒为间隔,没有注册的用户无法进行设置,需要的话可以建立一个账户、登入,选择生成的文稿时间区间,最短为 0 秒,最长为 20 秒。
下图就是我使用 Good Tape 将音频格式转换为纯文字的效果,看得出来会有文稿及对应时间,格式为 .txt,无论是 Windows 或是 macos 都能正常打开。
注册 Good Tape 账户时可直接使用 google 账号登入,或是设置 Email 和密码建立一个账户。
登入后操作方式大同小异,差异是可选择文稿的时间间距,最短 0 秒、最长可到 20 秒,从结果页面右下进行选择,这个功能在没有注册登入时无法使用。
后来我试着找另一段视频进行中文测试,将 MP3 音频文件上传到 Good Tape,然后选择语言为中文。
通过 Good Tape 也能将中文音频正确转为文字格式的文稿,从下方选择下载 .txt 或 .srt 格式,如果平常工作或生活上会需要听打文稿,可先使用 Good Tape 转换为大纲后再从文字中进行校稿,可能会更节省时间哦!