一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视频不仅清晰度高,而且时序连贯,细节丰富,具有很高的真实感和艺术性。
将微信或企业微信个人号接入ChatGpt、文心一言、FastGpt、LinkAI等,实现文字对话、语音对话、图片交互、文件交互等功能
帮助你发现优秀中文项目,可以无语言障碍地、更高效地吸收优秀经验成果
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间
专为商业级分布式深度学习而设计的开源工具包。
一个为React开发者提供强大AI集成能力的工具集,通过简化AI功能的集成过程,使得创建交互式和智能的Web应用变得更加容易。
一个模型,它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。
FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进
识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。
一个基于扩散变换器的序列生成模型,通过其强大的生成能力,生成一致性的序列图像。
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
基于私有LLM(大语言模型)做个人的文档问答
一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。
全文本搜索引擎库
简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署,专注于数据安全、隐私保护和高效的AI对话体验。
谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。
一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。
使用 GPT-4 自动化您的浏览器 在插件中输入自然语言命令,你就可以操控浏览器,例如创建Google日历、搜索、播放视频。
Eraser是工程团队的文档和图表创建工具,支持架构图、数据流图、设计文档等,提供多人协作和Eraser AI功能。
自动为视频生成高亮字幕
借助大语言模型(LLM)处理音频的工具
一个统一可控的视觉生成模型
你的全能AI开发助手
一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。
一种图像到3D框架,可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。
基于Chatgpt自主开发的翻译软件,支持翻译、输出、润色、分析和代码批注
一个现代化的在线简历编辑器,它基于 Next.js 和 Framer Motion 构建,可以让用户能够轻松创建专业的简历。
自动音乐生成研究的演示网站列表
一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。