开源 - hao123上网导航

开源

SlimPic (瘦图)

免费、高效的浏览器端批量图片压缩工具，支持AVIF、JPEG、JXL、PNG、WebP等多种格式，无需上传，保护隐私，可调节质量设置。

LibreTV

免费、开源的在线视频搜索平台，智能广告过滤、安全可靠，支持多种部署方式，让您随时随地享受高质量的观影体验。

MeterSphere

MeterSphere 是新一代的开源持续测试工具，让软件测试工作更简单、更高效，不再成为持续交付的瓶颈。

DevUI

DevUI是一款开源免费的企业中后台产品前端的通用解决方案，旨在为设计师，前端开发者提供标准的设计体系，全部代码开源并遵循 MIT 协议，任何企业、组织及个人均可免费使用。

OpenWispr

OpenWispr是一款由AI技术驱动的语音转文本工具，注重隐私保护，完全开源。其主要优点在于处理速度快、隐私保护严格，适用于写作、编程等领域。

DailiCode

Daili Code 是一个开源的命令行 AI 工具，兼容多种大语言模型，能够连接到您的工具、理解代码并加速工作流程。它支持多种 LLM 提供商，提供强大的自动化和多模态能力，适合开发者和技术人员使用。

JoyAgent-JDGenie

JoyAgent-JDGenie 是一个通用的多智能体框架，能够快速构建智能体产品，用户只需输入任务或查询，即可获得直接的解决方案。该产品强调高完成度和轻量化设计，具有较强的通用性，并在 GAIA 榜单上表现出色，适合于需要快速响应和高效执行的企业或开发者。该产品免费开源，定位于提供便捷的智能体开发解决方案。

OmniGen2

OmniGen2 是一个高效的多模态生成模型，结合了视觉语言模型和扩散模型，能够实现视觉理解、图像生成及编辑等功能。其开源特性为研究人员和开发者提供了强大的基础，助力个性化和可控生成 AI 的探索。

Openjourney

Openjourney 是一个高保真的开源项目，旨在模拟 MidJourney 的界面，利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像，以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者，提供了用户友好的界面和实时生成体验，能够助力创意工作与项目开发。

12306 MCP Server

12306 MCP Server 是一个基于 Model Context Protocol (MCP) 的高性能火车票查询后端系统，提供实时余票查询、车站信息和换乘方案等功能，适合与 AI / 自动化助手集成。该系统的主要优点在于其快速响应和易于集成，支持的标准化接口使其成为一个强大的数据聚合工具，适用于需要高效查询火车票的场景。该产品免费开源，适合开发者和企业使用。

Chatterbox AI

Chatterbox 是 Resemble AI 推出的第一个开源生产级文本转语音 (TTS) 模型，具有卓越的性能和稳定性。它经过与顶尖闭源系统的比较，展现出更优的效果。该模型的独特之处在于它支持情感夸张控制，适用于制作视频、游戏、AI 代理等多种场景。Chatterbox 的价格竞争力强，同时提供超低延迟，适合生产使用。

Caffe官网

CaffeUC伯克利研究推出的深度...Caffe是一款由Berkeley AI Research实验室开发的开源深度学习框架，具有高效的设计和执行，广泛应用于计算机视觉、自然语言处理等领域。

Facebook(Meta) AI

Meta AI是一款强大的人工智能平台，为开发者提供丰富的AI模型和工具，帮助他们创造出非凡的体验。

OpenStack CLI

OpenStack是一个开源的云计算基础设施软件项目，提供虚拟机管理、存储管理、网络管理、身份认证和访问控制等功能，适用于企业私有云、公共云服务提供商和学术研究等场景。

Genesis

Genesis3D开源引擎是一款功能强大的3D图形引擎，适用于游戏开发和虚拟现实应用，提供了丰富的工具和功能，帮助开发者轻松创建出精彩的作品。

开源软件库

oschina收录上万开源软件

Aigur.dev

Aigur是一个免费且开源的生成式人工智能管道库，它提供了托管的管道执行、用户管理、管道分析、计划管理和安全功能。

Kiri.art

Kiri.Art是一个免费、开源的网络UI前端，用于Stability.AI的稳定扩散，它可以帮助艺术家、设计师和开发人员生成惊人的艺术图像。

Panto AI

Panto AI 是一个编程辅助工具，通过代码审查来预防缺陷代码进入生产环境。它通过全天候运作，暴露代码中的漏洞并建议修复措施，确保只有无缺陷的代码被推送到生产环境。Panto AI 不仅检查错误，还理解代码背后的意图，并与知识库无缝集成，提供更智能的洞察。产品背景信息显示，Panto AI 已经开源其代码，并在GitHub上获得社区支持。

Xapian

Xapian是一个开源的搜索引擎库，提供高级索引和搜索功能，支持多种加权模型和布尔查询操作符。

SmolVLM-500M-Instruct

SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型，属于 SmolVLM 系列。该模型基于 Idefics3 架构，专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入，生成文本输出，适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行，同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证，支持开源和灵活的使用场景。

InternLM3-8B-Instruct

InternLM3-8B-Instruct是InternLM团队开发的大型语言模型，具有卓越的推理能力和知识密集型任务处理能力。该模型在仅使用4万亿高质量词元进行训练的情况下，实现了比同级别模型低75%以上的训练成本，同时在多个基准测试中超越了Llama3.1-8B和Qwen2.5-7B等模型。它支持深度思考模式，能够通过长思维链解决复杂的推理任务，同时也具备流畅的用户交互能力。该模型基于Apache-2.0许可证开源，适用于需要高效推理和知识处理的各种应用场景。

奇客资讯网

科技资讯网站，主要面对开源自由软件和关心科技资讯读者群

SkyReels-V1-Hunyuan-I2V

SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。它通过高质量影视片段训练，能够生成具有电影级质感的视频内容。该模型在开源领域达到了行业领先水平，尤其在面部表情捕捉和场景理解方面表现出色。其主要优点包括开源领先性、先进的面部动画技术和电影级光影美学。该模型适用于需要高质量视频生成的场景，如影视制作、广告创作等，具有广泛的应用前景。

智元灵犀X1开发指南

智元灵犀X1是一款开源人形机器人，具有29个关节和2个夹爪，支持扩展头部3自由度。它提供了详细的开发指南和开源代码，使开发者能够快速搭建并进行二次开发。该产品代表了智能机器人领域的先进技术，具有高度的灵活性和可扩展性，适用于教育、研究和商业开发等多种场景。

QwQ-Max-Preview

QwQ-Max-Preview 是 Qwen 系列的最新成果，基于 Qwen2.5-Max 构建。它在数学、编程以及通用任务中展现了更强的能力，同时在与 Agent 相关的工作流中也有不错的表现。作为即将发布的 QwQ-Max 的预览版，这个版本还在持续优化中。其主要优点包括深度推理、数学、编程和 Agent 任务的强大能力。未来计划以 Apache 2.0 许可协议开源发布 QwQ-Max 以及 Qwen2.5-Max，旨在推动跨领域应用的创新。

F Lite

F Lite 是由 Freepik 和 Fal 开发的一个大型扩散模型，具有 100 亿个参数，专门训练于版权安全和适合工作环境 (SFW) 的内容。该模型基于 Freepik 的内部数据集，包含约 8000 万张合法合规的图像，标志着公开可用的模型在这一规模上首次专注于合法和安全的内容。它的技术报告提供了详细的模型信息，并且使用了 CreativeML Open RAIL-M 许可证进行分发。该模型的设计旨在推动人工智能的开放性和可用性。

Agent-as-a-Judge

Agent-as-a-Judge 是一种新型的自动化评估系统，旨在通过代理系统的互相评估来提高工作效率和质量。该产品能够显著减少评估时间和成本，同时提供持续的反馈信号，促进代理系统的自我改进。它被广泛应用于 AI 开发任务中，特别是在代码生成领域。该系统具备开源特性，便于开发者进行二次开发和定制。

MLX-Auto-Subtitled-Video-Generator

一款基于 Apple MLX 框架构建的开源字幕生成工具，针对苹果硅芯片 Mac 优化，高效且成本效益高。

VideoSeal

VideoSeal 是一个开源的视频水印项目，由 Facebook Research 提供。该项目包括预训练模型、训练代码、推理代码和评估工具，全部在 MIT 许可证下发布。VideoSeal 能够将信息嵌入视频内容中，用于版权保护、内容验证等目的。它支持视频和图像水印，并提供了与现有最先进图像水印技术的对比基准。VideoSeal 的主要优点包括开放性、高效性以及对视频和图像水印的双重支持。

12 3…7