Ai开源项目 - 第 5 页 - hao123上网导航

Ai开源项目

I2VGen-XL：阿里推出的图生视频模型

一个强大的图像到视频的生成模型，它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频，生成的视频不仅清晰度高，而且时序连贯，细节丰富，具有很高的真实感和艺术性。

WeChat-AIChatbot

将微信或企业微信个人号接入ChatGpt、文心一言、FastGpt、LinkAI等，实现文字对话、语音对话、图片交互、文件交互等功能

GitHub中文排行榜

帮助你发现优秀中文项目，可以无语言障碍地、更高效地吸收优秀经验成果

Open Interpreter

结合OpenAI API，在本地运行代码解释器，可以联网，有更全的库，不限制文件大小和运行时间

Microsoft Cognitive Toolkit

专为商业级分布式深度学习而设计的开源工具包。

一个为React开发者提供强大AI集成能力的工具集，通过简化AI功能的集成过程，使得创建交互式和智能的Web应用变得更加容易。

Segment-Anything

一个模型，它提供了运行推理的代码、训练模型的检查点下载链接以及示例笔记本。

FreeAskInternet

FreeAskInternet 是一个完全免费、私有且本地运行的搜索聚合器，并使用 LLM 生成答案，无需 GPU。用户可以提出问题，系统将使用searxng进

识别视频中的人物的面部和身体动作，为后续的SD绘图提供支持

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。

MakeAnything

一个基于扩散变换器的序列生成模型，通过其强大的生成能力，生成一致性的序列图像。

EmotiVoice易魔声

EmotiVoice是一个强大的开源TTS引擎，完全免费，支持中英文双语，包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

基于私有LLM（大语言模型）做个人的文档问答

一个以Rust为基础构建的AI智能体框架，整合了ICP区块链并且支持TEE环境，Anda的目标在于构建一个能够高度组合、自主运行且拥有持续记忆能力的AI智能体网络。

全文本搜索引擎库

简洁易用的大模型本地部署工具，支持开源模型 DeepSeek-R1， DLlama 3, Phi-4, Mistral, Gemma 3 等模型的本地化部署，专注于数据安全、隐私保护和高效的AI对话体验。

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

PDFMathTranslate

一款开源的PDF文档翻译工具，专为翻译科技论文等PDF文件而设计。PDFMathTranslate能够完整保留原文的排版，包括公式和图表，并支持双语对照，保持原有目录结构。

使用 GPT-4 自动化您的浏览器在插件中输入自然语言命令，你就可以操控浏览器，例如创建Google日历、搜索、播放视频。

Eraser是工程团队的文档和图表创建工具，支持架构图、数据流图、设计文档等，提供多人协作和Eraser AI功能。

AutoCaption

自动为视频生成高亮字幕

借助大语言模型（LLM）处理音频的工具

一个统一可控的视觉生成模型

你的全能AI开发助手

一个实时编辑脸部表情和头部位置的AI工具。用户可以通过简单的拖放界面，轻松调整面部特征和表情，使静态的肖像变得生动。

一种图像到3D框架，可以从单视图图像高效生成高质量的3D网格。具有最先进的生成保真度和强大的通用性。

openai-translator

基于Chatgpt自主开发的翻译软件，支持翻译、输出、润色、分析和代码批注

Magic Resume

一个现代化的在线简历编辑器，它基于 Next.js 和 Framer Motion 构建，可以让用户能够轻松创建专业的简历。

文字生成音乐工具大全

自动音乐生成研究的演示网站列表

AniPortrait

一款由腾讯研究人员开发的音频驱动的肖像动画合成框架，AniPortrait能够根据音频和静态人脸图片生成逼真的动态视频。

1…3 456 7 8