Ai开源项目 - 第 5 页 - hao123上网导航

Ai开源项目

Segment-Anything

一个模型，它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。

FreeAskInternet

FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器，并使用 LLM 生成答案，无需 GPU。用户可以提出问题，系统将使用searxng进

识别视频中的人物的面部和身体动作，为后续的SD绘图提供支持

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。

MakeAnything

一个基于扩散变换器的序列生成模型，通过其强大的生成能力，生成一致性的序列图像。

EmotiVoice易魔声

EmotiVoice是一个强大的开源TTS引擎，完全免费，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

基于私有LLM（大语言模型）做个人的文档问答

一个以Rust为基础构建的AI智能体框架，整合了ICP区块链并且支持TEE环境，Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。

全文本搜索引擎库

简洁易用的大模型本地部署工具，支持开源模型 DeepSeek-R1， DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署，专注于数据安全、隐私保护和高效的AI对话体验。

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

使用 GPT-4 自动化您的浏览器在插件中输入自然语言命令，你就可以操控浏览器，例如创建Google日历、搜索、播放视频。

Eraser是工程团队的文档和图表创建工具，支持架构图、数据流图、设计文档等，提供多人协作和Eraser AI功能。

AutoCaption

自动为视频生成高亮字幕

借助大语言模型（LLM）处理音频的工具

一个统一可控的视觉生成模型

你的全能AI开发助手

一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面，轻松调整面部特征和表情，使静态的肖像变得生动。

一种图像到3D框架，可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。

openai-translator

基于Chatgpt自主开发的翻译软件，支持翻译、输出、润色、分析和代码批注

Magic Resume

一个现代化的在线简历编辑器，它基于 Next.js 和 Framer Motion 构建，可以让用户能够轻松创建专业的简历。

文字生成音乐工具大全

自动音乐生成研究的演示网站列表

AniPortrait

一款由腾讯研究人员开发的音频驱动的肖像动画合成框架，AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。

EasyPhoto是一个用于生成AI肖像的Webui UI插件，可以用来训练与你相关的数字化替身。

基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目，用于自动回复微信消息或管理微信群/好友。

llama2-webui

一个公共的GitHub代码库，用于在GPU或CPU上从任何地方运行具有gradio用户界面的Llama 2

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

码多多ChatWork知识库系统

码多多ChatWork智能知识库，可以进行AI对话、AI应用，拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景，具有较大的商业使用价值。

基于大规模扩散的高保真通用图像恢复模型，SupIR能够根据文本提示进行智能修复，提高图像修复的质量和智能程度。

1…3 456 7