Kel是一个智能的命令行助手,支持多种语言模型,可以帮助用户解答问题、提供技术支持和进行文件交互。
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。
一个开放平台,用于训练、服务和评估基于大型语言模型的聊天机器人
一键免费部署私人 ChatGPT+Midjourney 网页应用 支持原ChatGPT-Next-Web所有功能 还额外支持AI绘图、图片放大、识图、 混图、垫图等等功能
一款革命性的语音面部动画生成工具,借助 Media2Face,现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。
FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调
SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能,后台自定义添加,用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。
一个基于ExcelDNA开发的Excel聊天机器人。它与Office和WPS兼容,并提供了一些功能特点。
AI助力房产税务,高效专业
一个基于深度学习的视频超分辨率(SR)和视频增强(VE)框架,由北京大学元培学院的研究团队开发。
一个基于 LLM 大语言模型的知识库的集成客服系统,提供开箱即用的智能客服解决方案。
AI角色动画工具,通过先进的视频处理和3D渲染技术,MotionShop能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。
一个集合了各种流行的模型和服务的一站式平台,提供包括 OpenAI、Midjourney、Claude、讯飞星火、Stable Diffusion、DALL·E 等一站式的解决方案
一款适用于搭建内部培训平台的开源系统,旨在为企业/机构打造自己品牌的内部培训平台
从照片到 3D 头像
一个用于音频处理和生成的深度学习库
为用户提供可在电脑端和手机端使用的嵌入工具。这些工具能够帮助用户创建、训练和部署机器学习模型,以解决各种实际问题
一个开源项目,它可以实现 API 形式的调用 AI 绘图。
一个基于.NET开发的开源AI多智能体应用开发框架,它可以快速将大型语言模型(LLMs)快速集成到现有业务系统中。
多语言视觉文本生成和编辑工具,它基于扩散模型,能够在图片中生成或编辑文字
声音克隆和对话交互。它允许用户与喜欢的角色进行沉浸式对话,通过使用ChatGLM2模型和SadTalker模型来生成对话内容,并结合声音克隆技术实现角色的真实声音
一个开源的聊天用户界面,基于OpenAI聊天模型搭建的高级聊天机器人套件
字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。
PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。
Higgsfield是一款基于人工智能的视频模型,帮助用户轻松创建高质量的定制化视频内容,提供完全控制和独特视觉效果,适用于广告营销和品牌推广。
AI Companion App,一键创建和训练属于你的AI伴侣/女朋友。
高级语音和Deepfake神经网络工具
腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象
通过动画的形式展示了所有 LeetCode 上的问题的解题思路