NVIDIA Toronto AI Lab是由Sanja Fidler教授领导的人工智能实验室,成立于2018年,位于多伦多。该实验室的研究方向涉及计算机视觉、机器学习和计算机图形学等领域,并与多伦多大学和Vector Institute等学术实验室紧密合作。[0]
NVIDIA在多伦多开设了办公室,并于2018年投资建立了一个由Sanja Fidler领导的人工智能研究实验室,该实验室将成为NVIDIA在多伦多的重要存在。该实验室的目标是在今年年底之前将在该实验室工作的AI和深度学习研究人员数量增加三倍。实验室将成为一流的AI人才工作的场所,并将扩大办公室的规模,以容纳人才的涌入。[1]
该实验室的成员包括来自多伦多大学机器学的研究生和高年级本科生,以及来自NVIDIA Toronto AI Lab的研究科学家。该实验室的研究重点是计算机视觉和深度学习,与自然语言处理有关。[0][2]
在GTC上,NVIDIA发布了65个全新的和更新的SDK,包括Triton推理服务器的重大更新,Triton模型分析器、多GPU多节点功能、RAPIDS FIL和Amazon SageMaker集成等等。Triton是一个分布式推理引擎,为所有AI模型和框架提供跨平台推理。TensorRT已经与TensorFlow、PyTorch集成,并提供比框架内推理快3倍的性能。此外,NVIDIA推出了NVIDIA A2 Tensor Core GPU,这是一款用于边缘AI推理的低功耗、小尺寸的加速器,其推理性能比CPU高出20倍。[3]
数据统计
相关导航

CosyVoice 2是由阿里巴巴集团的SpeechLab@Tongyi团队开发的语音合成模型,它基于监督离散语音标记,并结合了两种流行的生成模型:语言模型(LMs)和流匹配,实现了高自然度、内容一致性和说话人相似性的语音合成。该模型在多模态大型语言模型(LLMs)中具有重要的应用,特别是在交互体验中,响应延迟和实时因素对语音合成至关重要。CosyVoice 2通过有限标量量化提高语音标记的码本利用率,简化了文本到语音的语言模型架构,并设计了块感知的因果流匹配模型以适应不同的合成场景。它在大规模多语言数据集上训练,实现了与人类相当的合成质量,并具有极低的响应延迟和实时性。