Microsoft SAM Text to Speech 是一个基于浏览器的文本转语音工具,重现了经典的Windows XP语音合成器,提供怀旧的语音体验。
TTS Omni 是一个基于大语言模型(LLM)的免费文本转语音(TTS)工具,提供多种语言和语气控制功能。
悦音配音是制片帮旗下配音品牌,提供ai智能配音文字转语音以及真人配音服务。可以在线将文字转成语音的智能配音工具。悦音配音情绪主播声音媲美真人主播,是一款ai智能在线配音神...
NiceVoice是一款免费的AI声音克隆工具,能够通过人工智能技术快速生成和克隆各种声音。支持多种用途,如配音,语音合成,语音助手等。该工具操作简单,效果显著,适合内容创作者使用。
冬瓜配音是一款专业文字转语音的AI配音软件,采用先进的 AI 大模型语音合成技术,快速实现将文字转换成语音。冬瓜配音有多款配音主播,还包括方言主播和外语主播,支持添加背景音乐,支持设置语速、配音音量、背景音乐音量等。冬瓜配音可以用来制作广告促销、地摊叫卖、小说推文、宣传片配音、短视频配音的等多种场景,是您学习、工作、生活中的必备配音软件。
ArcTime Pro是一款易用、强大、高效的跨平台字幕制作软件,提供精准的音频波形图,支持AI语音识别、自动打轴和语音合成,可以快速创建和编辑字幕时间轴,支持多种字幕格式导出和高质量视频压制。
GlimmerAI使用GPT-3和DALL-E 2,根据用户的文本和语音请求生成视觉上令人惊叹的演示。
Sonantic是一款动态语音演绎工具,可以根据文本生成高质量的声音表演,适用于游戏、影视制作和广告等领域。
讯飞智作是一款AI虚拟主播和语音合成配音网站,提供高质量的视频制作和文字转语音服务,适用于广告宣传、教育培训等多个领域。
OuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术,它不需要外部适配器或复杂架构,通过精心设计的提示和音频标记实现高质量的语音合成。该模型基于LLaMa架构,使用350M参数,展示了直接使用语言模型进行语音合成的潜力。它通过三个步骤处理音频:使用WavTokenizer进行音频标记化、CTC强制对齐创建精确的单词到音频标记映射、以及遵循特定格式的结构化提示创建。OuteTTS的主要优点包括纯语言建模方法、声音克隆能力、与llama.cpp和GGUF格式的兼容性。
GPT-3 with AI Voices是一款结合了GPT-3和ChatGPT的语音合成工具,可以实时生成高质量的语音合成和先进的文本生成,适用于广告、游戏对话和帮助台等场景。
Speaking AI是一款基于生成式语音AI技术的语音合成平台,能够实现自然情感的语音合成和零样本语音克隆,为用户提供个性化的声音应用。
仅需 5 秒音频样本,即可克隆你的声音 无需登录 免费无限制使用。
Text To Speech,文字转语音,文本朗读,让机器能够说话。构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音。借助高表现力和类似人类的神经语音,让你的方案生动起来。
Yandex SpeechKit是一款强大的文本转语音和语音识别服务,帮助您的业务实现智能语音助手、自动化呼叫中心等多种任务。它可以快速准确地识别语音,并为您的品牌提供独特的声音。
Audiojam AI扒谱软件是一款集合和弦&音调分析、乐器伴奏分离、AB循环、降速播放等多功能于一体的软件,能有效地提高扒谱效率以及练习效率。
Reecho睿声是一款超拟真语音合成和瞬时克隆平台,能够为视频制作、有声内容创作和语音助手等场景提供与真人无异的语音效果。
A.I.智能客服解决方案是科大讯飞基于其先进的语音技术,为企业提供的一套完整的客户服务系统。该系统通过电话、Web、APP、小程序、自助终端等多种渠道,实现智能外呼、智能接听、语音导航、在线文字客服、质检分析、坐席辅助等功能。它通过高识别率的语音识别引擎、自然流畅的语音合成技术、智能打断能力、IVR导航以及客服平台中间件等技术,帮助企业提高客服效率,降低人力成本,同时提升客户服务体验。
最像真人发声的在线文字转语音配音工具,长文本转换需要付费才能使用
Playtext是一个将文章转化为有声读物的工具,帮助用户以3倍速度阅读,提高阅读效率和理解能力。
科大讯飞AI虚拟主播解决方案利用讯飞的语音合成、人脸建模、形象驱动、图像处理等多项人工智能技术,实现了文本到视频的自动输出,并支持主播多语言视频生成。AI虚拟主播系统是“一站式虚拟主播视频生产和编辑服务”的系统,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析。
Realistic Text to Speech是一款准确、自然、灵活的文本转语音工具,为客户服务和内容创作提供更好的声音体验。
SteosVoice是一个提供高质量TTS服务的语音合成网站。该网站提供了多种语音类型,可用于视频翻译、广告等多种应用场景。此外,SteosVoice还提供了一个telegram机器人,每个人每天可以免费合成5000个符号。
Deepgram Voice Agent API 是一个统一的语音到语音API,它允许人类和机器之间进行自然听起来的对话。该API由行业领先的语音识别和语音合成模型提供支持,能够自然且实时地听、思考和说话。Deepgram致力于通过其语音代理API推动语音优先AI的未来,通过集成先进的生成AI技术,打造能够进行流畅、类似人类语音代理的业务世界。
字幕说是一款在线语音合成、字幕及视频生成工具,适用于自媒体人快速制作视频内容,提供逼真的语音合成与匹配的字幕,大大缩短了视频制作的时间。
Llasa-3B 是一个强大的文本到语音(TTS)模型,基于 LLaMA 架构开发,专注于中英文语音合成。该模型通过结合 XCodec2 的语音编码技术,能够将文本高效地转换为自然流畅的语音。其主要优点包括高质量的语音输出、支持多语言合成以及灵活的语音提示功能。该模型适用于需要语音合成的多种场景,如有声读物制作、语音助手开发等。其开源性质也使得开发者可以自由探索和扩展其功能。
iSpeech是一款强大的语音平台,提供文本转语音和语音识别功能,支持超过30种语言,适用于教育培训、语音导航、语音助手和语音广告等场景。
声咔AI配音是在线配音软件平台,垂直深度音频效率工具,支持30多种个性化调音功能等,限制少对用户友好。
讯飞智作是一款集AI配音、虚拟人视频生成、PPT生成视频、虚拟人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。
讯飞在线语音合成开放平台,网页下滑可以在线试用,支持将文本转换为逼真的语音效果,不过有字数限制