Ai开源项目 - 第 3 页 - hao123上网导航

Ai开源项目

Kel是一个智能的命令行助手，支持多种语言模型，可以帮助用户解答问题、提供技术支持和进行文件交互。

AnyDoor，由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor，可以将一张照片上的任何物品传送到另一张图片的世界中。

一个开放平台，用于训练、服务和评估基于大型语言模型的聊天机器人

ChatGPT+Midjourney

一键免费部署私人 ChatGPT+Midjourney 网页应用支持原ChatGPT-Next-Web所有功能还额外支持AI绘图、图片放大、识图、混图、垫图等等功能

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

FunASR 基础语音识别工具包

FunASR是一个基础语音识别工具包，提供多种功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程，支持预训练好的模型的推理与微调

SparkAi系统

SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能，后台自定义添加，用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。

一个基于ExcelDNA开发的Excel聊天机器人。它与Office和WPS兼容，并提供了一些功能特点。

ARTE – Artificial Real Estate

AI助力房产税务，高效专业

Video-LLaVA

一个基于深度学习的视频超分辨率（SR）和视频增强（VE）框架，由北京大学元培学院的研究团队开发。

懒人客服

一个基于 LLM 大语言模型的知识库的集成客服系统，提供开箱即用的智能客服解决方案。

AI角色动画工具，通过先进的视频处理和3D渲染技术，MotionShop能够高效地将视频中的某个角色替换为3D人物，同时不改变视频中的其他场景和人物。

一个集合了各种流行的模型和服务的一站式平台，提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案

一款适用于搭建内部培训平台的开源系统，旨在为企业/机构打造自己品牌的内部培训平台

从照片到 3D 头像

一个用于音频处理和生成的深度学习库

为用户提供可在电脑端和手机端使用的嵌入工具。这些工具能够帮助用户创建、训练和部署机器学习模型，以解决各种实际问题

MidJourney Proxy

一个开源项目，它可以实现 API 形式的调用 AI 绘图。

一个基于.NET开发的开源AI多智能体应用开发框架，它可以快速将大型语言模型（LLMs）快速集成到现有业务系统中。

多语言视觉文本生成和编辑工具，它基于扩散模型，能够在图片中生成或编辑文字

ChatGLM2-Voice-Cloning

声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话，通过使用ChatGLM2模型和SadTalker模型来生成对话内容，并结合声音克隆技术实现角色的真实声音

一个开源的聊天用户界面，基于OpenAI聊天模型搭建的高级聊天机器人套件

DiffusionGPT

字节跳动开发的由LLM驱动文本生成图像多合一系统，专门设计用于为不同的输入提示生成高质量的图像。

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

PIA是一款个性化图像动画生成器，可以生成具有高运动可控性和强文本和图像对齐性的视频，与条件图像对齐，通过文本实现动作控制，与各种个性化T2I模型兼容，无需特定调整。

Higgsfield是一款基于人工智能的视频模型，帮助用户轻松创建高质量的定制化视频内容，提供完全控制和独特视觉效果，适用于广告营销和品牌推广。

AI Companion App

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

高级语音和Deepfake神经网络工具

腾讯AI实验室开发的一个实时目标检测工具，它能够自动识别和定位图像中的各种对象

LeetCodeAnimation

通过动画的形式展示了所有 LeetCode 上的问题的解题思路

1 234 5…8