一个模型,它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。
FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器,并使用 LLM 生成答案,无需 GPU。用户可以提出问题,系统将使用searxng进
识别视频中的人物的面部和身体动作,为后续的SD绘图提供支持
一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。
一个基于扩散变换器的序列生成模型,通过其强大的生成能力,生成一致性的序列图像。
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
基于私有LLM(大语言模型)做个人的文档问答
一个以Rust为基础构建的AI智能体框架,整合了ICP区块链并且支持TEE环境,Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。
全文本搜索引擎库
简洁易用的大模型本地部署工具,支持开源模型 DeepSeek-R1, DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署,专注于数据安全、隐私保护和高效的AI对话体验。
谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,确保了生成视频的连贯性和逼真度。
一款开源的PDF文档翻译工具,专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版,包括公式和图表,并支持双语对照,保持原有目录结构。
使用 GPT-4 自动化您的浏览器 在插件中输入自然语言命令,你就可以操控浏览器,例如创建Google日历、搜索、播放视频。
Eraser是工程团队的文档和图表创建工具,支持架构图、数据流图、设计文档等,提供多人协作和Eraser AI功能。
自动为视频生成高亮字幕
借助大语言模型(LLM)处理音频的工具
一个统一可控的视觉生成模型
你的全能AI开发助手
一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面,轻松调整面部特征和表情,使静态的肖像变得生动。
一种图像到3D框架,可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。
基于Chatgpt自主开发的翻译软件,支持翻译、输出、润色、分析和代码批注
一个现代化的在线简历编辑器,它基于 Next.js 和 Framer Motion 构建,可以让用户能够轻松创建专业的简历。
自动音乐生成研究的演示网站列表
一款由腾讯研究人员开发的音频驱动的肖像动画合成框架,AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。
EasyPhoto是一个用于生成AI肖像的Webui UI插件,可以用来训练与你相关的数字化替身。
基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。
一个公共的GitHub代码库,用于在GPU或CPU上从任何地方运行具有gradio用户界面的Llama 2
AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。
码多多ChatWork智能知识库,可以进行AI对话、AI应用,拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景,具有较大的商业使用价值。
基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。