Openjourney:结合 Google AI 强力功能,成为 MidJourney 的开源选择
发布时间:2025-07-24 18:02:30 | 责任编辑:吴昊 | 浏览量:18 次
近日 ,由 @ammaar 开发的创新项目 Openjourney 引发广泛关注。这款工具不仅在界面上巧妙模仿了 MidJourney,更在技术核心上深度整合了 Google Gemini SDK,并集成了强大的 Imagen4和 Veo2/3模型,为用户提供了一站式的 AI 图像和视频生成解决方案。Openjourney 旨在让用户轻松利用 AI 生成高质量的图像和视频,同时享受与 MidJourney 相似的直观交互体验。
Openjourney 充分利用 Imagen4模型,能根据用户输入的文字描述生成四张1024x1024像素的高清图片。它的界面设计借鉴了 MidJourney 经典的四宫格布局,并加入了实时加载动画,大大提升了用户体验。生成的图片可以直接下载、放大查看,甚至能一键转换为视频。
在视频生成方面,Openjourney 同样表现出色:通过 Veo3模型,用户只需输入文字描述,即可生成一段带音频的3-5秒720p 短视频;借助 Veo2模型,静态图片也能“动起来”,用户选择一张图片并添加文字描述,即可将其转化为动画视频。视频内容以2x2网格形式展示,鼠标悬停即可自动播放,交互性极强。
Openjourney 在用户体验方面也考量周全。其输入框简洁直观,用户输入提示词后点击“生成”或按下回车即可开始。平台支持全屏查看和下载作品,并通过箭头键方便用户翻阅生成历史,如同翻看相册一般。界面的流畅动画效果得益于 Framer Motion,而加载时的“骨架屏”占位则进一步提升了专业感。
Openjourney 的技术栈现代且 robust,非常适合开发者学习和二次开发。它采用 Next.js15(包含 App Router 和 Turbopack)作为前端框架,确保了出色的性能和开发体验;使用 TypeScript 提升了代码可靠性;基于 Tailwind CSS v4快速构建美观界面;利用 Framer Motion 实现流畅的交互效果;并整合了 ShadCN 和 Radix UI 保证界面的美观性和无障碍标准。其核心 AI 能力正是通过 Google Gemini SDK 调用 Imagen4和 Veo2/3模型来实现图像和视频生成。
Openjourney 的发布,无疑为开源社区带来了 MidJourney 的一个强大且充满潜力的替代方案,展示了 Google AI 技术在创意应用领域的广阔前景。
GitHub
以下是 MidJourney 开源替代品的相关信息:
- DreamShaper:基于 Stable Diffusion 开发的模型,专为生成照片级逼真图像设计,可成为 MidJourney 的开源替代品,支持动漫和绘画风格,提供更大自由度调整输出效果,可通过本地或在线GPU加速工具(如 Sinkin.ai、RandomSeed 或 Mage.space)运行。
- Stable Diffusion:一个免费开源的文本到图像模型,支持本地安装(需8GB VRAM)或在线使用,有多个版本(如1.5、2.1、XL测试版),虽图像质量略逊于 MidJourney,但功能强大,支持多种图像生成工具。
- InvokeAI:基于 Stable Diffusion 的模型,提供网站和命令行界面,专注于帮助用户创建基于知识产权的视觉效果,支持自定义工作流程。
这些工具为 MidJourney 提供了开源替代方案,用户可根据需求选择适合的模型进行图像生成。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。