Sparsh是一系列通过自监督算法(如MAE、DINO和JEPA)训练的通用触觉表示。它能够为DIGIT、Gelsight'17和Gelsight Mini生成有用的表示,并在TacBench提出的下游任务中大幅度超越端到端模型,同时能够为新下游任务的数据高效训练提供支持。Sparsh项目包含PyTorch实现、预训练模型和与Sparsh一起发布的数据集。
Stable-Makeup是一个基于PyTorch实现的妆容迁移模型,能够稳定地将不同风格的真实世界妆容应用到人脸图像上。
126课时从简单到复杂带领大家深入学习和应用深度学习技术。
OLMo-2-1124-7B-DPO是由Allen人工智能研究所开发的一个大型语言模型,经过特定的数据集进行监督式微调,并进一步进行了DPO训练。该模型旨在提供在多种任务上,包括聊天、数学问题解答、文本生成等的高性能表现。它是基于Transformers库构建的,支持PyTorch,并以Apache 2.0许可发布。
stable-audio-tools是一个开源的PyTorch库,提供了用于条件音频生成的生成模型的训练和推理代码。包括自动编码器、隐式扩散模型、MusicGen等。支持多GPU训练,可以生成高质量的音频。
Reformer-pytorch是一个高效的Transformer模型,具有LSH attention、可逆网络和分块等特性,适用于自然语言处理和语音识别等任务。
AudioLCM是一个基于PyTorch实现的文本到音频生成模型,它通过潜在一致性模型来生成高质量且高效的音频。该模型由Huadai Liu等人开发,提供了开源的实现和预训练模型。它能够将文本描述转化为接近真实的音频,具有重要的应用价值,尤其是在语音合成、音频制作等领域。