语音合成

Microsoft SAM Text to Speech

Microsoft SAM Text to Speech 是一个基于浏览器的文本转语音工具，重现了经典的Windows XP语音合成器，提供怀旧的语音体验。

TTS Omni

TTS Omni 是一个基于大语言模型（LLM）的免费文本转语音（TTS）工具，提供多种语言和语气控制功能。

悦音ai配音

悦音配音是制片帮旗下配音品牌，提供ai智能配音文字转语音以及真人配音服务。可以在线将文字转成语音的智能配音工具。悦音配音情绪主播声音媲美真人主播，是一款ai智能在线配音神...

NiceVoice

NiceVoice是一款免费的AI声音克隆工具，能够通过人工智能技术快速生成和克隆各种声音。支持多种用途，如配音，语音合成，语音助手等。该工具操作简单，效果显著，适合内容创作者使用。

冬瓜配音

冬瓜配音是一款专业文字转语音的AI配音软件，采用先进的 AI 大模型语音合成技术，快速实现将文字转换成语音。冬瓜配音有多款配音主播，还包括方言主播和外语主播，支持添加背景音乐，支持设置语速、配音音量、背景音乐音量等。冬瓜配音可以用来制作广告促销、地摊叫卖、小说推文、宣传片配音、短视频配音的等多种场景，是您学习、工作、生活中的必备配音软件。

arctime Pro

ArcTime Pro是一款易用、强大、高效的跨平台字幕制作软件，提供精准的音频波形图，支持AI语音识别、自动打轴和语音合成，可以快速创建和编辑字幕时间轴，支持多种字幕格式导出和高质量视频压制。

Glimmer

GlimmerAI使用GPT-3和DALL-E 2，根据用户的文本和语音请求生成视觉上令人惊叹的演示。

Sonantic

Sonantic是一款动态语音演绎工具，可以根据文本生成高质量的声音表演，适用于游戏、影视制作和广告等领域。

讯飞智作 AI虚拟主播数字人制作

讯飞智作是一款AI虚拟主播和语音合成配音网站，提供高质量的视频制作和文字转语音服务，适用于广告宣传、教育培训等多个领域。

OuteTTS-0.1-350M

OuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术，它不需要外部适配器或复杂架构，通过精心设计的提示和音频标记实现高质量的语音合成。该模型基于LLaMa架构，使用350M参数，展示了直接使用语言模型进行语音合成的潜力。它通过三个步骤处理音频：使用WavTokenizer进行音频标记化、CTC强制对齐创建精确的单词到音频标记映射、以及遵循特定格式的结构化提示创建。OuteTTS的主要优点包括纯语言建模方法、声音克隆能力、与llama.cpp和GGUF格式的兼容性。

GPT-3 Custom AI Voices

GPT-3 with AI Voices是一款结合了GPT-3和ChatGPT的语音合成工具，可以实时生成高质量的语音合成和先进的文本生成，适用于广告、游戏对话和帮助台等场景。

Speaking AI

Speaking AI是一款基于生成式语音AI技术的语音合成平台，能够实现自然情感的语音合成和零样本语音克隆，为用户提供个性化的声音应用。

AI Clone Voice Free 语音克隆

仅需 5 秒音频样本，即可克隆你的声音无需登录免费无限制使用。

TTS-文字转语音

Text To Speech，文字转语音，文本朗读，让机器能够说话。构建自然说话的应用和服务，从 147 种语言和变体中选择 456 种语音。借助高表现力和类似人类的神经语音，让你的方案生动起来。

Yandex SpeechKit

Yandex SpeechKit是一款强大的文本转语音和语音识别服务，帮助您的业务实现智能语音助手、自动化呼叫中心等多种任务。它可以快速准确地识别语音，并为您的品牌提供独特的声音。

Audiojam AI扒谱软件

Audiojam AI扒谱软件是一款集合和弦&音调分析、乐器伴奏分离、AB循环、降速播放等多功能于一体的软件，能有效地提高扒谱效率以及练习效率。

Reecho AI睿声

Reecho睿声是一款超拟真语音合成和瞬时克隆平台，能够为视频制作、有声内容创作和语音助手等场景提供与真人无异的语音效果。

讯飞A.I.智能客服解决方案

A.I.智能客服解决方案是科大讯飞基于其先进的语音技术，为企业提供的一套完整的客户服务系统。该系统通过电话、Web、APP、小程序、自助终端等多种渠道，实现智能外呼、智能接听、语音导航、在线文字客服、质检分析、坐席辅助等功能。它通过高识别率的语音识别引擎、自然流畅的语音合成技术、智能打断能力、IVR导航以及客服平台中间件等技术，帮助企业提高客服效率，降低人力成本，同时提升客户服务体验。

OneTTS

最像真人发声的在线文字转语音配音工具，长文本转换需要付费才能使用

PlayText

Playtext是一个将文章转化为有声读物的工具，帮助用户以3倍速度阅读，提高阅读效率和理解能力。

科大讯飞-AI虚拟主播

科大讯飞AI虚拟主播解决方案利用讯飞的语音合成、人脸建模、形象驱动、图像处理等多项人工智能技术，实现了文本到视频的自动输出，并支持主播多语言视频生成。AI虚拟主播系统是“一站式虚拟主播视频生产和编辑服务”的系统，为开发者免费提供：涵盖语音能力增强型SDK，一站式人机智能语音交互解决方案，专业全面的移动应用分析。

Realistic Text to Speech

Realistic Text to Speech是一款准确、自然、灵活的文本转语音工具，为客户服务和内容创作提供更好的声音体验。

SteosVoice

SteosVoice是一个提供高质量TTS服务的语音合成网站。该网站提供了多种语音类型，可用于视频翻译、广告等多种应用场景。此外，SteosVoice还提供了一个telegram机器人，每个人每天可以免费合成5000个符号。

Deepgram Voice Agent API

Deepgram Voice Agent API 是一个统一的语音到语音API，它允许人类和机器之间进行自然听起来的对话。该API由行业领先的语音识别和语音合成模型提供支持，能够自然且实时地听、思考和说话。Deepgram致力于通过其语音代理API推动语音优先AI的未来，通过集成先进的生成AI技术，打造能够进行流畅、类似人类语音代理的业务世界。

字幕说-在线语音合成、字幕及视频生成工具

字幕说是一款在线语音合成、字幕及视频生成工具，适用于自媒体人快速制作视频内容，提供逼真的语音合成与匹配的字幕，大大缩短了视频制作的时间。

Llasa-3B

Llasa-3B 是一个强大的文本到语音（TTS）模型，基于 LLaMA 架构开发，专注于中英文语音合成。该模型通过结合 XCodec2 的语音编码技术，能够将文本高效地转换为自然流畅的语音。其主要优点包括高质量的语音输出、支持多语言合成以及灵活的语音提示功能。该模型适用于需要语音合成的多种场景，如有声读物制作、语音助手开发等。其开源性质也使得开发者可以自由探索和扩展其功能。

ISpeech

iSpeech是一款强大的语音平台，提供文本转语音和语音识别功能，支持超过30种语言，适用于教育培训、语音导航、语音助手和语音广告等场景。

声咔AI配音

声咔AI配音是在线配音软件平台，垂直深度音频效率工具，支持30多种个性化调音功能等，限制少对用户友好。

讯飞智作-虚拟主播

讯飞智作是一款集AI配音、虚拟人视频生成、PPT生成视频、虚拟人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。

讯飞在线语音合成

讯飞在线语音合成开放平台，网页下滑可以在线试用，支持将文本转换为逼真的语音效果，不过有字数限制

12 3 4