PixArt-Σ是一款基于Diffusion Transformer的图文生成模型,能够直接生成4K分辨率的高保真图像,满足用户对高质量视觉内容的需求。
HoloDreamer是一款基于文本描述生成全景式3D场景的创新框架,支持多种风格的场景生成,视觉一致性强,重建质量高。
一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调,即可实现一致的视频编辑效果。