11:51
VITA-1.5:开源多模态视频语音大模型
VITA-1.5 是一个开源的多模态视频语音大模型,类似于 GPT-4o,支持实时视频语音交互。它基于 Qwen2.5 模型,具备随时打断的功能。演示视频效果不错,值得一看。佬们可以在VITA-1.5 GitHub 仓库了解更多。
此外,Sam 还发了个推,目前每月 200 美元的 OpenAI Pro 订阅服务正在经历巨额亏损,利好老黄。