AI新闻 | 第 3 页

已选标签:

AI视频

模型突破

1月 7日

3 条新闻

11:51

VITA-1.5：开源多模态视频语音大模型

VITA-1.5 是一个开源的多模态视频语音大模型，类似于 GPT-4o，支持实时视频语音交互。它基于 Qwen2.5 模型，具备随时打断的功能。演示视频效果不错，值得一看。佬们可以在VITA-1.5 GitHub 仓库了解更多。

来源：三花快讯

11:51

OpenAI CEO Sam Altman 预测：2025 年 AI 代理将加入劳动力市场

Reflections 是 OpenAI 的 CEO Sam Altman 在其博客上发表的一篇文章。文中，他表达了对构建传统意义上的通用人工智能（AGI）的强烈信心，并预测到 2025 年，AI 代理将“加入劳动力市场”，从而实质性地改变公司的产出方式。

此外，Sam 还发了个推，目前每月 200 美元的 OpenAI Pro 订阅服务正在经历巨额亏损，利好老黄。

来源：三花快讯

11:51

阿里开源 VideoRefer：利用 LLM 实现视频对象感知与推理

VideoRefer 是阿里开源的一项专门用于视频中对象的感知和推理的技术。该技术包括数据集、模型和基准测试三大核心组件，能够对用户定义的区域进行细粒度的感知、推理和检索，支持单帧和多帧输入。简单来说，就是利用 LLM 来理解视频内容。目前，该模型的代码和模型均已开源。

来源：三花快讯

1月 4日

1 条新闻

00:00

微软计划在2025财年投入800亿美元用于人工智能数据中心

微软计划在2025财年投入800亿美元建设AI数据中心，主要用于训练AI模型和部署全球AI及云应用。其中超半数投资将用于美国，旨在推动AI技术创新和生产力提升。微软与OpenAI正合作开发名为Stargate的AI超级计算机数据中心，预计耗资超1000亿美元。此举凸显AI对算力和电力的巨大需求，可能引发数据中心电力短缺问题，同时也标志着AI基础设施建设的全球竞争加剧。

来源：TechCrunch AI