我最近在深入研究人工智能相关话题,发现有很多类似的问题需要探讨。比如:ChatGPT、DALL-E、Gemini、Veo3 等。我的问题是,哪一款人工智能最适合用来制作视频和生成图像呢?
你要是做“图”那块,最稳的几个是 Midjourney(画风细腻但偏艺术)和 DALL·E(OpenAI家的,适合偏现实/精准控制)。要出高清图还得看 SD(Stable Diffusion)+一些插件,比如 ComfyUI 或 InvokeAI,能玩得很细。
做视频的,目前主流两个方向:
一个是图转视频,Runway 和 Pika 比较流行,Veo(谷歌的)虽然看起来猛,但现在普通用户还用不上;
另一个是AI生成口播/动画,像 HeyGen、Synthesia、D-ID 都在用,适合做那种“AI角色讲解视频”。
如果你是想做那种“又能生成图、又能剪视频、还能写脚本”的一体化工具,可以考虑把 ChatGPT(配插件)当中控,再调用上面那些工具。