已选标签:
AI视频
模型突破
1月 15日
4 条新闻
15:00

Synthesia以21亿美元估值为其B2B人工智能视频平台筹集1.8亿美元

Synthesia 凭借其高度逼真的 AI 虚拟人技术,在企业级视频生成领域取得显著进展,已服务 60,000 家企业,用户达 100 万。最新完成 1.8 亿美元 D 轮融资,估值达 21 亿美元。公司计划扩展亚太市场,并持续优化虚拟人技术,包括提升动作真实性、环境适应性和交互能力。Synthesia 依赖第三方大语言模型和语音技术,专注于产品自研,避免并购。AI 视频功能日益普及,Synthesia 致力于成为企业视频交互的首选平台,同时面临 AI 能耗、版权和伦理等挑战。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI

01:49

24岁创业者退出首家公司加入Coinbase,为其新项目筹集300万美元

Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具,嵌入企业现有产品中,提供自动化分类、对账和财务报告功能。通过优化数据层,结合 LLM 技术,Open Ledger 解决了传统会计软件的效率和安全问题,目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资,计划扩展团队并支持百万级用户。

来源:TechCrunch AI

1月 14日
4 条新闻
18:26

Bioptimus筹集4100万美元开发“生物学领域的GPT”

法国 AI 初创公司 Bioptimus 获 4100 万美元融资,致力于开发生物学领域的基础 AI 模型。该模型旨在通过从分子到生物体的多模态数据中学习,模拟生物系统以预测疾病结果并加速药物研发。Bioptimus 已发布开源病理学基础模型 H-Optimus-0,并计划推出覆盖更广治疗领域的多模态模型。其技术挑战包括处理敏感临床数据、优化模型训练及扩展数据源。此举标志着 AI 在生物医学领域的深度应用,未来有望推动医疗、生物技术及化妆品等行业的创新突破。

来源:TechCrunch AI

07:38

微软成立新的内部开发导向型AI组织

微软成立新工程组织 CoreAI,整合现有开发与 AI 平台团队,加速 AI 基础设施和软件开发。由前 Meta 技术高管 Jay Parikh 领导,专注于“模型优先”应用,旨在重塑所有应用类别。此举凸显微软将 AI 作为核心战略,推动大语言模型和多模态技术在智能助手、AI 编程等领域的创新与落地。

来源:TechCrunch AI

00:56

24岁创业者从首家公司转向Coinbase,为其新创项目筹集300万美元

OpenLedger 推出 AI 驱动的模块化会计工具,通过嵌入式组件和 API 提供自动化分类、对账和财务报告功能。该平台利用大语言模型(LLM)优化数据处理,同时确保数据安全,避免暴露消费者数据。OpenLedger 的目标是帮助中小型企业减少会计时间,提升效率。其创新点在于重新设计了金融交易的数据层,解决了上下文限制、延迟和安全问题。公司计划通过招聘和内部模型训练,进一步扩展其在 SaaS、金融科技和银行领域的应用。

来源:TechCrunch AI

1月 13日
4 条新闻
23:25

穆迪同意收购Cape Analytics,该公司为保险提供商开发地理空间人工智能技术

Moody’s 收购地理空间 AI 初创公司 Cape Analytics,旨在利用其 AI 技术优化保险承保流程。Cape 通过卫星图像和算法提取结构化数据,生成详细的物业信息数据库,为保险公司提供精准风险评估。此次收购反映了保险行业加速 AI 应用的趋势,预计到 2032 年全球 AI 保险市场规模将达 798.6 亿美元。尽管 AI 可能引入偏见,但其在提升理赔效率和整体运营效率方面的潜力推动了行业应用。Cape 的技术结合 Moody’s 的全球资源,有望进一步扩展国际市场,并深化在金融领域的应用。

来源:TechCrunch AI

20:06

更多资金注入AI医疗:Qventus以超4亿美元估值获得1.05亿美元融资

AI 医疗初创公司 Qventus 完成 1.05 亿美元 D 轮融资,估值超 4 亿美元,资金将用于扩展 AI 助手在手术、住院/门诊管理等场景的应用。公司通过机器学习和生成式 AI 技术,优化临床和管理工作流程,提升效率。生成式 AI 的引入增强了处理非结构化数据的能力,支持实时响应临床需求。此次融资凸显了 AI 医疗领域的投资热度,Qventus 客户增长四倍,核心业务增长三倍,接近盈亏平衡。

来源:TechCrunch AI

09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

1月 12日
1 条新闻
05:30

研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型

UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。

来源:TechCrunch AI

1月 11日
1 条新闻
01:24

50亿美元直播购物应用、英伟达的发布以及 CES 上最奇特的技术

CES 2025 展示了 AI 技术的多样化应用与创新趋势,包括智能家居设备(如机器人吸尘器)和智能眼镜等消费级产品。Nvidia 的 Project Digits 项目预示了 AI 在边缘计算和实时交互领域的潜力,可能推动未来初创企业的技术突破。尽管部分企业仍处于实验阶段,但 AI 在提升用户体验和优化硬件性能方面的进展显著。此外,Meta 的‘更多言论,更少错误’策略反映了 AI 在内容审核和自然语言处理中的持续优化需求。

来源:TechCrunch AI

1月 8日
4 条新闻
16:17

微软通过公共和私营部门的交易支持其在印度的30亿美元人工智能计划

微软宣布在印度核心领域展开广泛AI合作,计划投资30亿美元,与政府及企业合作推动AI技术应用。重点包括:支持印度AI数据集平台的数据收集与合成生成,培训50万名AI技术人才,建立AI卓越中心及20个AI实验室。合作涵盖铁路、医疗、金融、制造和教育领域,如与RailTel合作推进铁路数字化和AI转型,与Apollo Hospitals开发医疗AI助手,与Bajaj Finance合作实现年成本节约1800万美元。此举旨在与谷歌、亚马逊等竞争,加速AI在印度的商业落地和人才培养,推动多模态AI和边缘计算等技术的应用。

来源:TechCrunch AI

09:43

英伟达开源 Cosmos 世界模型:助力机器人与自动驾驶数据生成

英伟达开源了 Cosmos 世界模型,这模型支持文生视频和文+视频生视频,主要应用于机器人和自动驾驶领域的大规模合成数据生成。

目前,英伟达已经开放了多个不同的预训练模型,这些模型均支持商业用途。佬友们也可以在线体验下,看看这个模型的实际效果如何。

来源:三花快讯

09:12

山姆·阿尔特曼的家人回应他涉嫌性侵其妹妹的诉讼

OpenAI CEO Sam Altman 近期因家庭纠纷引发关注,但其对 AI 技术的贡献及 OpenAI 的发展方向仍是焦点。Altman 领导下的 OpenAI 持续推动大语言模型(如 GPT 系列)和多模态模型的创新,致力于 AGI 发展及技术伦理规范。尽管个人争议,OpenAI 在 AI 编程、智能助手、医疗诊断等领域的应用仍具重要影响力。未来,AI 技术的多模态融合、算力优化及可解释性将是关键发展方向。

来源:TechCrunch AI

01:30

实时更新 CES 2025:Nvidia 后续动态及 Linda Yaccarino 主题演讲,展会现场开启

Nvidia 在 CES 2025 上推出 Project Digits,一款个人 AI 超级计算机,搭载 Grace Blackwell 超级芯片,支持运行高达 2000 亿参数的模型。该设备旨在降低高性能 AI 计算的门槛,推动 AI 技术在边缘计算和个性化应用中的普及。同时,May Mobility 展示了电动自动驾驶小巴,进一步扩展 AI 在交通领域的落地场景。这些创新标志着 AI 技术向更高效、更普惠的方向发展,同时加速了 AI 在消费级和行业级应用的商业化进程。

来源:TechCrunch AI

1月 7日
2 条新闻
12:20

谷歌在2025年国际消费电子展上推出AI驱动的电视,为您总结新闻

谷歌在2025年国际消费电子展上推出AI驱动的电视,为您总结新闻

Google 在 CES 2025 推出基于 Gemini AI 助手的 TV 操作系统,新增新闻摘要功能。该功能通过整合互联网新闻和 YouTube 视频标题,生成每日新闻简报,提升用户获取信息的效率。此举标志着 Google 正式进入 AI 新闻摘要领域,尽管面临内容授权和 AI 幻觉等挑战。Google 计划通过自然语言交互和传感器技术,将 TV 转变为更智能的交互平台,推动多模态 AI 在家庭场景的落地。

来源:TechCrunch AI

12:19

英伟达发布自有品牌的全球模型

英伟达发布自有品牌的全球模型

Nvidia 在 CES 2025 上发布了 Cosmos World Foundation Models (Cosmos WFMs),这是一系列基于物理感知的视频预测与生成的世界模型。这些模型分为 Nano、Super 和 Ultra 三类,参数规模从 40 亿到 140 亿不等,适用于低延迟、高性能和高保真输出场景。Cosmos WFMs 可用于生成合成数据,支持自动驾驶、机器人等领域的模型训练。Nvidia 还提供了上采样模型、增强现实视频解码器和安全护栏模型,确保负责任的使用。模型训练基于 9000 万亿 token 的多样化数据,涵盖人类交互、环境和工业场景。尽管存在版权争议,Nvidia 强调其数据使用符合法律精神。Cosmos WFMs 的开放性和可定制性为物理 AI 研究和开发提供了强大工具。

来源:TechCrunch AI