一个免费的、开源的、全栈的SaaS(软件即服务)启动套件,适用于React + NodeJS
一个开源的数据标注平台,致力于优化对于大型语言模型(LLM)开发不可或缺的数据标注过程。
一种分层自适应零样本语音风格转换模型
一个AI自动投递简历的工具,结合chatgpt与rpa技术,实现一键自动寻找工作、根据自己的简历和工作描述生成求职信、发送给hr的全流程自动操作。
一个基于Web强大的开源PDF操作工具。它使您能够对 PDF 文件执行各种操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。
一个字节跳动开源的多模态 AI 代理工具,Agent TARS能够通过视觉方式解释网页内容,从而实现流畅的浏览器操作。
一个实现了在个人电脑上运行 LLM 模型,并集成了服务接口和在线聊天界面的项目。
代理 MidJourney 的discord频道,实现api形式调用AI绘图
在文本输入的同时立即开始语音合成,无需等待整个文本输入完毕。
LiveSketch是一款AI生成视频工具,用户通过文本提示将静态素描转化为动画,它提供了一种简单直观的方法,使他们的素描变得生动活泼。
一款开源免费的跨平台视频提取工具。支持流媒体下载、视频下载、m3u8 文件下载以及 B 站视频下载。
Rope AI换脸工具
Monoid是一款强大的AI平台,可以将API转化为智能代理,帮助用户实现自动化操作,提供灵活定制、实时响应的智能代理服务。
一个基于WhisperLive把声音转文字和WhisperSpeech理解这些文字的能力构建。能够与AI聊天机器人进行超低延迟对话。
Gemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。
ChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。
大幅提升扩散模型的图像生成质速度提升6倍,由字节跳动的研究团队开发,只需添加一行代码即可
一个开源的深度伪造工具包,用于生成逼真的深度伪造视频和图像。
一个开源的数据标注工具,可以帮助用户快速、准确、高效地对数据进行标注,从而提高机器学习模型的性能和质量。
腾讯AI实验室推出的 AI 绘图模型,效果类似 ControlNet,可以控制图片生成的效果
一个提供高质量搜索体验的开源AI驱动搜索引擎,Perplexica通过理解用户问题并利用机器学习算法来提供精准的搜索结果。
音频转文字
硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互。
ProPainter,一键移除视频内的移动物体,一键移除视频水印。
一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视频不仅清晰度高,而且时序连贯,细节丰富,具有很高的真实感和艺术性。
将微信或企业微信个人号接入ChatGpt、文心一言、FastGpt、LinkAI等,实现文字对话、语音对话、图片交互、文件交互等功能
帮助你发现优秀中文项目,可以无语言障碍地、更高效地吸收优秀经验成果
结合OpenAI API,在本地运行代码解释器,可以联网,有更全的库,不限制文件大小和运行时间
专为商业级分布式深度学习而设计的开源工具包。
一个为React开发者提供强大AI集成能力的工具集,通过简化AI功能的集成过程,使得创建交互式和智能的Web应用变得更加容易。