摘要

1) 一句话总结 作者分享了其日常进行复杂编程时,搭配使用 OpenAI o1、Claude 3.5 Sonnet、v0 和 Gemini 等不同 AI 模型与工具的具体分工与实战经验。

2) 核心要点

  • OpenAI o1(架构师/算法专家):推理能力最强,适合解决复杂算法、提供架构设计思路,能有效弥补开发者的经验盲区。
  • Claude 3.5 Sonnet(主力程序员):编码能力强、出活快且支持长上下文,最佳实践是由 o1 提供设计方案后交由 Claude 生成代码。
  • Cursor(首选 IDE):因上下文控制优秀成为作者首选;Windsurf 也是良好替代品,而 GitHub Copilot 目前主要用于编写单元测试。
  • v0.dev(前端制作):优势在于支持浏览器直接预览,可通过上传设计稿截图快速生成前端网页。
  • Claude 网页版(从零建站):在从无到有设计网页时表现优异,通过持续对话即可搭建网站,处理复杂需求时效果优于 v0。
  • Gemini(反向工程):支持视频和 2M Tokens 的超长上下文窗口,非常适合用于反编译和分析高达十几万行的混淆代码。

3) 风险与不足

  • OpenAI o1 存在上下文窗口不够长以及使用次数受限的问题。
  • Claude 3.5 Sonnet 的算法能力相对不足,有时写程序的思路不够清晰,需要其他模型辅助指导。
  • v0 在面对提示词过长或需要处理的情况太多时,生成效果可能不如 Claude。
  • 充分利用多款 AI 模型导致每个月在 AI 工具上的资金支出越来越高。

正文

最近用 AI 辅助编程比较多,对于复杂的算法和程序设计我是这么搭配使用的:

  • OpenAI o1:架构设计师、算法高手

  • Cursor/Claude 3.5 Sonnet:码农

  • v0/Claude 3.5 Sonnet: 网页设计制作

  • Gemini:反编译、反向工程师

o1 能力最强,但是上下文不够长,并且次数有限,复杂的算法最适合它,或者一些难一点的问题也可以咨询它,让它充当一个架构师的角色出一些点子,有时候甚至会超出我的期望,因为我自己可能会犯一些经验主义错误,或者在某些领域并不熟悉,这时候 o1 的广博知识和强大推理能力就发挥作用了。

Claude 写代码能力非常强、出活快,并且上下文很长,但是算法还不够好,有时候写程序的思路并不是很清晰,但是在 o1 的指导下可以发挥的更好。比如我就会让 o1 给出思路或者设计方案,让 Claude 去生成代码。IDE 我还是喜欢用 Cursor 一点,主要是它上下文控制比较好,当然很多人喜欢的 Windsurf 也是很不错的,至于 GitHub Copilot,已经由一个领先者变成了追赶者了,但用来写单元测试还是不错的。

要做前端网页的话,v0.dev 是很有优势的,直接浏览器可以预览,把设计稿截图发过去就能生成个类似的网页。但如果从无到有设计个网页或者网站,Claude 的网页版我觉得比 v0 效果还好,你把一些基本的想法告诉它,它就能给你做出来个不错的网页。持续提要求甚至一个简单的网站都可以搭出来了。v0 可能提示词太长要处理的情况太多,有时候反而不如 Claude 网页上做出来效果好。当然还有些人喜欢用 bolt.new,也是很好的。

Gemini 可能被很多人低估,一直被笼罩在 OpenAI 和 Claude 的光环下,但最近一直在升级迭代,编码能力已经相当不错了,尤其是支持视频和2M Tokens的长上下文窗口。所以有时候我需要反向分析别人混淆后的代码的时候,就会把完整的几万行甚至十几万行代码扔过去,让它帮我分析。

不得不说,充分利用好这些 AI 模型,真的是可以事半功倍的,唯一的问题是每个月花在 AI 上的钱越来越多了。

关联主题