AI新闻 | 第 2 页

已选标签:

多模态AI

AI视频

1月 13日

4 条新闻

09:47

快手 Kling APP 登陆美区 App Store，安卓版即将推出

Kling APP 现已正式上架美区 App Store，安卓版本也即将上线。

简单体验了一下，和 Web 版本差不多，支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。

来源：三花快讯

09:47

Adobe FaceLift：单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术，仅需一张人脸照片，就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图，然后通过 GS-LRM 重建器生成 3D 高斯样条表示，实现全头新视角的合成。

此外，FaceLift 还能处理视频输入，进行 4D 合成，并与 2D 动画技术结合，实现 3D 面部动画。

从官网的一些交互式案例来看，效果还不错，不过不能放大看，恐怖谷效应拉满了。目前这项技术还没有开源，关注我为你持续跟进。

来源：三花快讯

09:47

FitDiT：开源 AI 虚拟试穿模型，支持上衣、下衣或整套更换

FitDiT 是一个开源的 AI 虚拟试穿模型，其最大的特色是支持用户选择更换上衣、下衣或整套服装。佬友们可以在线试用一下。

不过我用下来感觉整体效果不如之前介绍的 Leffa。Leffa 前几天还更新了一波，在 A100 上生成只需 6 秒，速度相当快。

来源：三花快讯

09:47

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI，支持 Qwen 全系列模型。

模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型，以及 Qwen2.5-Coder-32B-Instruct 编程模型。

Qwen Chat 支持同时对比多个模型，还即将推出网络搜索、图像生成和语音模式，值得期待。

来源：三花快讯

1月 11日

2 条新闻

02:26

实时更新 CES 2025：活动临近尾声，最终发布与分析

CES 2025 展示了 AI 技术在自动驾驶和智能硬件领域的显著进展。Waymo 和 Cruise 前 CEO Kyle Vogt 的新机器人公司亮相，凸显了自动驾驶技术的持续创新。NVIDIA 展示了 RTX Blackwell GPU 系列，推动 AI 模型训练和推理效率提升。此外，AI 可穿戴设备如 Halliday 智能眼镜和 Based Hardware 的 Omi 成为焦点，预示着 AI 在日常生活中的广泛应用。尽管美国车企缺席，中国电动车品牌 Zeekr 等展示了 AI 在汽车行业的深度整合，进一步推动了多模态 AI 和边缘计算的发展。

来源：TechCrunch AI

01:24

50亿美元直播购物应用、英伟达的发布以及 CES 上最奇特的技术

CES 2025 展示了 AI 技术的多样化应用与创新趋势，包括智能家居设备（如机器人吸尘器）和智能眼镜等消费级产品。Nvidia 的 Project Digits 项目预示了 AI 在边缘计算和实时交互领域的潜力，可能推动未来初创企业的技术突破。尽管部分企业仍处于实验阶段，但 AI 在提升用户体验和优化硬件性能方面的进展显著。此外，Meta 的‘更多言论，更少错误’策略反映了 AI 在内容审核和自然语言处理中的持续优化需求。

来源：TechCrunch AI

1月 8日

5 条新闻