GPT-4o实时语音交互的开源方案,一款基于Llama-3.1-8B-Instruct构建的低延迟、高质量的端到端语音交互模型:LLaMA-Omni
特点: 低延迟语音交互,延迟低至 226 毫秒 能够同时生成文本和语音响应
github:https://github.com/ictnlp/LLaMA-Omni 模型:https://huggingface.co/ICTNLP/Llama-3.1-8B-Omni