免费、高效的浏览器端批量图片压缩工具,支持AVIF、JPEG、JXL、PNG、WebP等多种格式,无需上传,保护隐私,可调节质量设置。
免费、开源的在线视频搜索平台,智能广告过滤、安全可靠,支持多种部署方式,让您随时随地享受高质量的观影体验。
MeterSphere 是新一代的开源持续测试工具,让软件测试工作更简单、更高效,不再成为持续交付的瓶颈。
DevUI是一款开源免费的企业中后台产品前端的通用解决方案,旨在为设计师,前端开发者提供标准的设计体系,全部代码开源并遵循 MIT 协议,任何企业、组织及个人均可免费使用。
OpenWispr是一款由AI技术驱动的语音转文本工具,注重隐私保护,完全开源。其主要优点在于处理速度快、隐私保护严格,适用于写作、编程等领域。
Daili Code 是一个开源的命令行 AI 工具,兼容多种大语言模型,能够连接到您的工具、理解代码并加速工作流程。它支持多种 LLM 提供商,提供强大的自动化和多模态能力,适合开发者和技术人员使用。
JoyAgent-JDGenie 是一个通用的多智能体框架,能够快速构建智能体产品,用户只需输入任务或查询,即可获得直接的解决方案。该产品强调高完成度和轻量化设计,具有较强的通用性,并在 GAIA 榜单上表现出色,适合于需要快速响应和高效执行的企业或开发者。该产品免费开源,定位于提供便捷的智能体开发解决方案。
OmniGen2 是一个高效的多模态生成模型,结合了视觉语言模型和扩散模型,能够实现视觉理解、图像生成及编辑等功能。其开源特性为研究人员和开发者提供了强大的基础,助力个性化和可控生成 AI 的探索。
Openjourney 是一个高保真的开源项目,旨在模拟 MidJourney 的界面,利用 Google 的 Gemini SDK 进行 AI 图像和视频生成。该项目支持使用 Imagen 4 生成高质量图像,以及使用 Veo 2 和 Veo 3 进行文本到视频和图像到视频的转换。它适合需要进行图像生成和视频制作的开发者和创作者,提供了用户友好的界面和实时生成体验,能够助力创意工作与项目开发。
12306 MCP Server 是一个基于 Model Context Protocol (MCP) 的高性能火车票查询后端系统,提供实时余票查询、车站信息和换乘方案等功能,适合与 AI / 自动化助手集成。该系统的主要优点在于其快速响应和易于集成,支持的标准化接口使其成为一个强大的数据聚合工具,适用于需要高效查询火车票的场景。该产品免费开源,适合开发者和企业使用。
Chatterbox 是 Resemble AI 推出的第一个开源生产级文本转语音 (TTS) 模型,具有卓越的性能和稳定性。它经过与顶尖闭源系统的比较,展现出更优的效果。该模型的独特之处在于它支持情感夸张控制,适用于制作视频、游戏、AI 代理等多种场景。Chatterbox 的价格竞争力强,同时提供超低延迟,适合生产使用。
CaffeUC伯克利研究推出的深度...Caffe是一款由Berkeley AI Research实验室开发的开源深度学习框架,具有高效的设计和执行,广泛应用于计算机视觉、自然语言处理等领域。
Meta AI是一款强大的人工智能平台,为开发者提供丰富的AI模型和工具,帮助他们创造出非凡的体验。
OpenStack是一个开源的云计算基础设施软件项目,提供虚拟机管理、存储管理、网络管理、身份认证和访问控制等功能,适用于企业私有云、公共云服务提供商和学术研究等场景。
Genesis3D开源引擎是一款功能强大的3D图形引擎,适用于游戏开发和虚拟现实应用,提供了丰富的工具和功能,帮助开发者轻松创建出精彩的作品。
oschina收录上万开源软件
Aigur是一个免费且开源的生成式人工智能管道库,它提供了托管的管道执行、用户管理、管道分析、计划管理和安全功能。
Kiri.Art是一个免费、开源的网络UI前端,用于Stability.AI的稳定扩散,它可以帮助艺术家、设计师和开发人员生成惊人的艺术图像。
Panto AI 是一个编程辅助工具,通过代码审查来预防缺陷代码进入生产环境。它通过全天候运作,暴露代码中的漏洞并建议修复措施,确保只有无缺陷的代码被推送到生产环境。Panto AI 不仅检查错误,还理解代码背后的意图,并与知识库无缝集成,提供更智能的洞察。产品背景信息显示,Panto AI 已经开源其代码,并在GitHub上获得社区支持。
Xapian是一个开源的搜索引擎库,提供高级索引和搜索功能,支持多种加权模型和布尔查询操作符。
SmolVLM-500M 是由 Hugging Face 开发的轻量级多模态模型,属于 SmolVLM 系列。该模型基于 Idefics3 架构,专注于高效的图像和文本处理任务。它能够接受任意顺序的图像和文本输入,生成文本输出,适用于图像描述、视觉问答等任务。其轻量级架构使其能够在资源受限的设备上运行,同时保持强大的多模态任务性能。该模型采用 Apache 2.0 许可证,支持开源和灵活的使用场景。
InternLM3-8B-Instruct是InternLM团队开发的大型语言模型,具有卓越的推理能力和知识密集型任务处理能力。该模型在仅使用4万亿高质量词元进行训练的情况下,实现了比同级别模型低75%以上的训练成本,同时在多个基准测试中超越了Llama3.1-8B和Qwen2.5-7B等模型。它支持深度思考模式,能够通过长思维链解决复杂的推理任务,同时也具备流畅的用户交互能力。该模型基于Apache-2.0许可证开源,适用于需要高效推理和知识处理的各种应用场景。
科技资讯网站,主要面对开源自由软件和关心科技资讯读者群
SkyReels V1 是一个基于 HunyuanVideo 微调的人类中心视频生成模型。它通过高质量影视片段训练,能够生成具有电影级质感的视频内容。该模型在开源领域达到了行业领先水平,尤其在面部表情捕捉和场景理解方面表现出色。其主要优点包括开源领先性、先进的面部动画技术和电影级光影美学。该模型适用于需要高质量视频生成的场景,如影视制作、广告创作等,具有广泛的应用前景。
智元灵犀X1是一款开源人形机器人,具有29个关节和2个夹爪,支持扩展头部3自由度。它提供了详细的开发指南和开源代码,使开发者能够快速搭建并进行二次开发。该产品代表了智能机器人领域的先进技术,具有高度的灵活性和可扩展性,适用于教育、研究和商业开发等多种场景。
QwQ-Max-Preview 是 Qwen 系列的最新成果,基于 Qwen2.5-Max 构建。它在数学、编程以及通用任务中展现了更强的能力,同时在与 Agent 相关的工作流中也有不错的表现。作为即将发布的 QwQ-Max 的预览版,这个版本还在持续优化中。其主要优点包括深度推理、数学、编程和 Agent 任务的强大能力。未来计划以 Apache 2.0 许可协议开源发布 QwQ-Max 以及 Qwen2.5-Max,旨在推动跨领域应用的创新。
F Lite 是由 Freepik 和 Fal 开发的一个大型扩散模型,具有 100 亿个参数,专门训练于版权安全和适合工作环境 (SFW) 的内容。该模型基于 Freepik 的内部数据集,包含约 8000 万张合法合规的图像,标志着公开可用的模型在这一规模上首次专注于合法和安全的内容。它的技术报告提供了详细的模型信息,并且使用了 CreativeML Open RAIL-M 许可证进行分发。该模型的设计旨在推动人工智能的开放性和可用性。
Agent-as-a-Judge 是一种新型的自动化评估系统,旨在通过代理系统的互相评估来提高工作效率和质量。该产品能够显著减少评估时间和成本,同时提供持续的反馈信号,促进代理系统的自我改进。它被广泛应用于 AI 开发任务中,特别是在代码生成领域。该系统具备开源特性,便于开发者进行二次开发和定制。
一款基于 Apple MLX 框架构建的开源字幕生成工具,针对苹果硅芯片 Mac 优化,高效且成本效益高。
VideoSeal 是一个开源的视频水印项目,由 Facebook Research 提供。该项目包括预训练模型、训练代码、推理代码和评估工具,全部在 MIT 许可证下发布。VideoSeal 能够将信息嵌入视频内容中,用于版权保护、内容验证等目的。它支持视频和图像水印,并提供了与现有最先进图像水印技术的对比基准。VideoSeal 的主要优点包括开放性、高效性以及对视频和图像水印的双重支持。