ChatGPT o1 会主动思考推理的 AI，新模型发布实测总结

OpenAI 今天发布「 ChatGPT o1-preview」，是会尝试主动思考的 AI 语言模型，ChatGPT Plus 订阅用户现在就可使用。

根据 OpenAI 的说法：「我们训练这些模型〔ChatGPT o1-preview〕在回应前花更多时间思考问题，就像人类一样。通过训练，它们学会精炼思考过程、尝试不同策略，并能察觉自己的错误。」「如果您正在解决科学、程序设计、数学和相关领域的复杂问题，这些增强的推理能力可能特别有用。」

我自己在讲 ChatGPT 提升工作效率的相关课程时，常常强调一个设计指令的重点：「如果我们写 AI 指令〔 prompt、提示语〕时，可以让 AI 写出自己在想什么、怎么处理任务，通常生成的内容结果会相对更好。」

从用户端的角度来看「ChatGPT o1-preview」，就是在 AI 生成内容前，会先展开一步一步的思考流程，它可能会选择思考的策略与切入点，有时会提出一些批判思考，也会更仔细的分析资料细节来做深入处理。

在这个过程中，「ChatGPT o1-preview」生成内容的速度其实比 GPT-4o 要慢上不少，可能需要 30~60 秒的思考时间〔或者更久〕，才会开始一步一步的生成内容。

也因为这样的「思考」过程需要耗费更多运算资源，所以即使是 ChatGPT Plus 用户，在使用「ChatGPT o1-preview」时也有一些限制：

目前无法上传文件、图片进行分析。〔2024/9/13〕
目前无法查找网络资料。〔2024/9/13〕
- 但 OpenAI 有预告上述功能之后都会补上。
o1-preview 和 o1-mini 都可以在模型选择器中手动选择，初始每周信息限制为 o1-preview 的 30 条，o1-mini 的 50 条。

也就是说，目前「ChatGPT o1-preview」比较像是「GPT-4o」的辅助，在进行一些需要深入分析资料、产出有逻辑结果的任务，或者像是科学、数学、程序代码相关领域时，可以运用。

今天这篇文章，我就从自己日常惯用的几个 AI 辅助需求：翻译、摘要、企划思考、文案，以及有时用代码写个小工具的角度，以实际案例测试看看，「ChatGPT o1-preview」的效果如何，并和「GPT-4o」同样指令下的结果作比较。

当然，如果能从科学、数学与代码的角度来验证更好，不过从我个人常用角度出发，也想验证看看 ChatGPT o1-preview 是否能满足我的日常工作需求，也提供大家参考。

下面，先提供大家下面测试案例的快速心得比较表格。

任务	ChatGPT o1-preview	GPT-4o	差异与结论
翻译	花费约 57 秒完成整篇文章翻译。翻译结果更简洁有力，文句白话流畅。用语更符合中文常用词汇。在「白话流畅度」与「专业用语」间平衡得更好。	翻译速度较快。翻译结果相对较弱，文句不如 o1-preview 流畅。	ChatGPT o1-preview 在翻译质量上优于 GPT-4o，虽然速度较慢，但结果更佳。
代码生成〔九九乘法小游戏〕	第一次生成的代码正确性高，界面美观，操作流畅。能计算分数并回馈对错。无需修改即可使用。	初次生成的代码有明显错误。需要多次反复调整才能达到可用程度。	ChatGPT o1-preview 在代码生成方面更准确、完善。
企划报告制定	主动进行反向思考，探索不同呈现方式。提供具体、逻辑分明的建议步骤和文章架构。深入分析资料细节。	建议较为一般化。缺乏深入的分析和明确的建议。	ChatGPT o1-preview 在企划思考上更深入、具体。
文章摘要	摘要更深入完整，有条理。能整理出详细的步骤和操作要点。	基本架构相似。细节完整程度略有不足。	ChatGPT o1-preview 在摘要上提供更详细的内容。
社交贴文与文案撰写	生成内容较为结构化，像是分析整理。缺乏社交贴文所需的流畅性和吸引力。更注重安全性和准确性，避免使用版权材料。	文案较为流畅，适合社交贴文风格。可能在细节上不够精准。	GPT-4o 在文案撰写上表现较佳，更适合社交贴文。