基于AI大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Azure, ChatGLM,讯飞星火,文心一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。
一个开源的全栈通用AI Agent,能从需求到成果交付全流程自动化。它在虚拟环境中可灵活调用各类工具,如编写并执行代码、智能浏览网页、操作网页应用、命令执行等。
一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。
Pick a Pic是一个支持AI学术研究的Web应用程序,通过收集人类反馈来评估AI生成的图像。用户可以生成、排名和下载图像,这些图像是由AI生成的。
文本来生成具有艺术风格的Cinemagraph动态图片
AI 画图工具,它结合了 Stable Diffusion 和 Midjourney 的优点
给出一段长视频,我们把它变成一个包含视觉+音频信息的文档。通过将这份文件发送给ChatGPT,我们就可以在视频中进行聊天了!
一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台,提供无广告的高清视频播放体验,具备倍速播放、离线缓存、稍后再看等功能。
一个能够帮助用户轻松收纳各种文档的强大工具,Simba可以作为一个后端知识库与任何检索增强生成(RAG)系统进行无缝集成。
一款专注于微信公众号排版的Markdown编辑器,支持移动端,搭配DeepSeek和微信公众号助手,利用碎片化时间,通过手机就能编辑并发布带有排版效果的公众号文章。
开源的商用级别数字人模型,普通用户可以直接使用安装包下载,开发者还可以根据自己的需求定制化开发。
Automated Github Reviews是一款智能的自动化代码审查工具,帮助开发者提高代码质量和开发效率。
一个使用OpenAI的Whisper Large v2进行语音识别的脚本,能够在短短10分钟内转录300分钟的音频。
一个由计算所、美团、腾讯等机构合作研发,专为电商场景设计,能够自动生成具有主播风格的AI虚拟主播带货视频神器。
LucidDreamer,可以从单个图像的单个文本提示中生成可导航的3D场景。 单击并拖动(导航)/移动和滚动(缩放)以感受3D。
数学图形可视化引擎
一个强大的 npm 包,它提供了一个在线浏览器中使用的抠图脚本
快速、轻量级搜索引擎
Deepfakes Creator,可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。
一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。
一款完全离线的OCR图片转文字识别软件,可以将图片中的文字提取并转换为可编辑的文本
支持文字生成视频和图片生成视频。
一个使用类型来构建自然语言界面的库。
Kel是一个智能的命令行助手,支持多种语言模型,可以帮助用户解答问题、提供技术支持和进行文件交互。
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。
一个开放平台,用于训练、服务和评估基于大型语言模型的聊天机器人
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能,后台自定义添加,用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。