EasyPhoto是一个用于生成AI肖像的Webui UI插件,可以用来训练与你相关的数字化替身。
基于WeChaty结合OpenAI ChatGPT、Kimi、讯飞等多种AI服务实现的开源微信机器人项目,用于自动回复微信消息或管理微信群/好友。
一个公共的GitHub代码库,用于在GPU或CPU上从任何地方运行具有gradio用户界面的Llama 2
AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。
码多多ChatWork智能知识库,可以进行AI对话、AI应用,拥有强大的第三方对接能力。适用企业智能客服、企业智能文档、专家顾问助理等多种企业级商业场景,具有较大的商业使用价值。
基于大规模扩散的高保真通用图像恢复模型,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。
一款开源的多语言AI配音和视频翻译工具,优质视频中文化工具,YouDub-webui提供了一套完整的视频中文化工具包,涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。
一个公共的代码存储库,主要用于BIliBili视频网站、抖音以及人工智能(AI)方面的虚拟主播项目
智能追踪,定制资讯
一个基于 Postgres 构建的超快速、实时、专业、开发人员友好的无代码数据库。Teable使用简单的、类似电子表格的界面来创建复杂的企业级数据库应用程序,无需编写代码。
一个强大的深度学习文本到语音工具包,具有高度的可定制性和多语言支持。
一个方便开发者使用的工具,它利用DeepL的免费服务,提供了一个本地API,让开发者可以轻松地集成到他们的项目中
一款开源、免费、离线的 Android 实时翻译应用程序。连接到拥有该应用程序的人,连接蓝牙耳机,将手机放入口袋中,然后您就可以像对方说您的语言一样进行对话。
一个强大的自动化视频制作工具,它可以自动采集素材、编辑视频、配音、生成字幕,从而简化了视频创建过程
一款使用生成AI技术来存储和检索非结构化信息的“第二大脑”
基于AI的图片/视频硬字幕去除、文本水印去除,无损分辨率生成去字幕、去水印后的图片/视频文件。无需申请第三方API,本地实现
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
由 Tohrusky 开发的一款图像超分辨率技术,它可以以更高的分辨率和质量重构图像。
一个可以自己托管的 Whisper 解决方案,服务端是 Python,客户端是 JS,基于 WebSocket 实时通信,可以做到语音的实时传输和文本转换。
一个完全开源的AI软件工程师,5分钟就能在本地电脑部署。
VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。
DreaMoving,一种基于扩散的可控视频生成框架,用于生成高质量的定制人类舞蹈视频。
Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。
LTX Video的简称,是由Lightricks推出的开源AI生成视频模型,LTX-Video 是第一个基于 DiT 的视频生成模型,可以实时生成具有逼真和多样化内容的高分辨率视频。
EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。
一款漂亮且功能强大的在线海报设计器,图片编辑器,仿稿定设计,迅排设计Poster-Design适用于海报生成、电商产品图、文章长图、视频/公众号封面等多种场景。
论文大师系统源码,可SaaS租用或者源码部署
解决AI图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。
一个基于AI的、开源有声书工具集,LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能,并且支持 GPU 加速、批量离线处理。
Grounded-SAM:将 Grounded DINO 与 Segment Anything、 Stable Diffusion和Recognize Anything 相结合 - 自动检测、分割和生成任何东西