摘要
1) 一句话总结 本文盘点并推荐了当前主流的对话式、图像生成及视频生成三大类人工智能工具,旨在帮助用户提升工作效率。
2) 关键要点
- 对话式AI(NewBing与ChatGPT):NewBing在必应搜索中集成最新GPT模型,支持对话、文案撰写与代码编写;ChatGPT基于GPT-3.5模型,支持多场景文本生成,并具备纠错和拒绝不当请求的能力。
- 对话式AI(文心一言):百度基于文心大模型推出的生成式AI产品,定于3月16日发布,支持对话、故事与诗歌等文本生成。
- 图像生成(Midjourney与DALL·E 2):Midjourney依托Discord运行(QQ频道内测中),支持一键生成多风格图像;DALL·E 2由OpenAI开发,支持通过浏览器与API平台接入。
- 图像生成(开源与专精模型):Stable Diffusion代码在GitHub完全免费开源,支持消费级显卡运行;NovelAI基于前者结合Danbooru图库优化,专精于动漫与CG风格人像生成。
- 图像生成(文心一格):百度出品的AI绘画工具,支持国风、油画等十余种风格的高清画作生成,并提供多种画幅选择。
- 视频生成(D-ID与Synthesia):D-ID专注于利用深度学习将静态照片动态化或通过图文生成视频;Synthesia提供含虚拟主持人和背景的视频生成服务,适用于教育和营销等领域。
- 视频生成(Fliki):文本转语音及视频工具,内置75种语言的850种声音,支持在2分钟内将脚本或博客文章快速转换为视频内容。
正文
全世界现在AI式工具多如牛毛,除了ChatGPT和midjourney以外,还有很多不为人知的非常好用的AI工具,我把我自己用过并且觉得偏主流的工具都整理了一遍,推荐给大家,希望大家也能用上以帮助自己提高效率

用一张图直接看,详细介绍在后面。
(另,公众号无法插入链接,所以我准备了一个带链接可以跳转到各个AI工具的文档,私信我2自动获取)
一. 对话式AI
- NewBing
微软在Bing中集成了最新版的GPT模型,除了传统的搜索外,还能够通过学习和理解人类的语言来进行对话,根据用户语言、兴趣和需求,提供最相关、最准确、最全面的信息。真正像人类一样来聊天交流,辅助你完成工作,甚至能完成撰写邮件、视频脚本、文案、翻译、代码、总结文档等任务。
想了解NewBing的话请看我的这篇文章 深度体验NewBing - 完胜ChatGPT的神之一手
- ChatGPT
全球最火的大语言模型AI, 它可以用自然语言和用户进行类似人类的对话,也可以完成其他很多任务,比如生成文本、写邮件、写论文、写代码等。ChatGPT是基于GPT3.5模型的,比之前的GPT3模型更加强大和智能。ChatGPT可以根据对话的内容回答问题,承认错误,提出异议,拒绝不合适的请求。 ChatGPT是一个令人印象深刻的AI工具,也是一个有趣的聊天伙伴。
- 文心一言
国内大语言模型的希望。 文心一言是百度推出的一款生成式AI产品,它可以根据用户的输入,生成各种类型的文本,如对话、故事、诗歌等。文心一言基于百度的文心大模型技术,能够理解用户的意图和情感,给出合适的回复。将于3月16号正式召开发布会与大家见面。
二.生成图片AI
- midjourney
midjourney是一个基于AI的绘图工具,它可以根据用户的文字描述,一键式生成各种风格的图片,如动漫、写实、油画等,傻瓜简单。midjourney完全运行在Discord上,用户只需要加入官方服务器,就可以在聊天室里输入想象的场景,然后等待AI返回图片。目前在QQ的频道栏目内测中。
- Stable Diffusion
由Stability AI开发,号称最强 文本生成图片的模型。 相比较于DALL-E等大模型,Stable Diffusion让用户使用消费级的显卡便能够迅速实现文生图。且 Stable Diffusion 完全免费开源,所有代码均在 GitHub 上公开,任何人都可以拷贝使用。之前也写了一篇关于Stable Diffusion的教程,见 AI绘图傻瓜指南 - 5分钟带你生成你的专属AI妹子
DALL·E 2
ChatGPT母公司OpenAI开发的文生图模型。 2021年1月发布的DALL·E的后续,可以在浏览器或API平台上使用,老牌图片生成模型,比较均衡。
NovelAI
NovelAI 就是用 Danbooru 的图片在 Stable Diffusion 的基础上做了模型的优化训练,Danbooru是一个图片搜索和分享网站,它主要提供了许多来自日本动画、漫画和游戏的图片。 NovelAI 几乎只能生成动漫、手绘、素描、CG 风格的图片,但在这些风格的人像上出图率更高,是专精型选手;
文心一格
“文心一格”是百度出品的AI绘画产品,国内的希望。 在 文心一格官网,用户只需输入自己的创想文字,并选择期望的画作风格,即可快速获取由一格生成的相应画作。 现已支持国风、油画、水彩、水粉、动漫、写实等十余种不同风格高清画作的生成,还支持不同的画幅选择。
三.生成视频AI
D-ID
D-ID专注于利用人工智能和深度学习开发的视频再现。他们的产品包括让静态照片动起来, 也可以用文字或语音生成高质量的视频。
Synthesia
Synthesia是一个利用人工智能生成视频的平台,可以让用户通过输入文字或语音,选择虚拟的主持人和背景,制作出逼真的视频内容。Synthesia的技术可以用于教育,培训,营销,娱乐等多个领域,帮助用户节省时间和成本,提高效率和创意。Synthesia的产品可以在网页浏览器中使用,操作简单。
Fliki
Fliki是一款逼真的文本转语音及视频的工具,它具有文本转语音功能以及丰富的用于视频内容的媒体库,用户在2分钟内就能使用逼真的声音从脚本或博客文章创建视频,该平台有75种语言的850种声音。
以上,这次先更新对话、图片、视频篇,下期更新音频、文章、其他篇。敬请期待!
看到最后了,大家别忘了关注我,私信我2获取这些工具的链接哦!
感恩!