Storytelling Chatbot

Storytelling Chatbot官网

该产品利用 Gemini 2.0 语言模型和 Google Imagen 图像生成技术，结合语音识别和语音合成，为用户提供一个互动式的故事创作体验。用户可以通过语音输入选择故事走向，系统会实时生成故事内容和相关图像。该产品的主要优点是创新的交互方式和强大的内容生成能力，适合用于教育、娱乐和创意启发。目前该产品处于开源阶段，未明确具体定价，主要面向开发者和教育机构。

Storytelling Chatbot是什么

Storytelling Chatbot是一个开源的语音交互式故事创作机器人，它结合了Gemini 2.0语言模型、Google Imagen图像生成技术、语音识别和语音合成技术，为用户提供沉浸式的“选择你自己的冒险”体验。你可以通过语音指令来引导故事的发展，系统会实时生成文本内容和相应的图片，带来更丰富的互动乐趣。它特别适合用于教育、娱乐和创意启发，目前主要面向开发者和教育机构。

Storytelling Chatbot的主要功能

Storytelling Chatbot的主要功能包括：语音指令输入、故事内容生成、图像生成、语音输出。它利用Deepgram实现语音转文字，Google Gemini 2.0生成故事内容，ElevenLabs将文本转换为语音，Google Imagen生成相关图片，为用户提供多感官的互动体验。此外，它支持自定义环境变量和本地运行/Docker部署。