已选标签:
AI训练
低成本训练
1月 21日
1 条新闻
01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 19日
2 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

1月 15日
5 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI

00:45

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

量子计算初创公司 SEEQC 宣布获得 3000 万美元融资,致力于通过芯片技术简化量子硬件复杂性,推动量子计算与经典计算的融合。SEEQC 与 Nvidia 合作开发超低延迟芯片间连接技术,旨在提升量子计算与 GPU 的协同效率,支持数据中心和企业级应用。量子计算有望加速新材料和药物研发,德国化工巨头 BASF 和 Merck 已参与 SEEQC 主导的 QuPharma 项目。SEEQC 的技术源于 Hypres 的成熟芯片制造能力,未来将加速商业化进程,推动量子计算在 AI 和数据中心领域的应用。

来源:TechCrunch AI

1月 14日
2 条新闻
18:26

Bioptimus筹集4100万美元开发“生物学领域的GPT”

法国 AI 初创公司 Bioptimus 获 4100 万美元融资,致力于开发生物学领域的基础 AI 模型。该模型旨在通过从分子到生物体的多模态数据中学习,模拟生物系统以预测疾病结果并加速药物研发。Bioptimus 已发布开源病理学基础模型 H-Optimus-0,并计划推出覆盖更广治疗领域的多模态模型。其技术挑战包括处理敏感临床数据、优化模型训练及扩展数据源。此举标志着 AI 在生物医学领域的深度应用,未来有望推动医疗、生物技术及化妆品等行业的创新突破。

来源:TechCrunch AI

10:46

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion 是一个开源方法,旨在通过充分利用每一刀从零开始训练大规模扩散模型。

任何人只需使用 8 个 H100 GPU,在短短 2.5 天内,就能以 1890 美元的超低成本,用 3700 万张公开可用的真实和合成图像,训练出一个 11.6 亿参数的稀疏 Transformer。

这比 Stable Diffusion 的训练成本低 118 倍!不过,从论文的基准测试来看,模型生成的图片质量仅略优于 SD1.5,放到现在可能有点不够看。

来源:三花快讯

1月 12日
1 条新闻
05:30

研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型

UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。

来源:TechCrunch AI

1月 8日
4 条新闻
12:15

印度政府网站仍在将用户重定向至诈骗网站

印度政府网站持续被植入诈骗链接,暴露网络安全漏洞。AI 技术可在内容管理系统(CMS)安全防护中发挥关键作用,通过深度学习检测异常行为、强化学习优化防御策略,以及联邦学习保护数据隐私。未来,AI 驱动的自动化安全解决方案有望提升政府网站的安全性,减少人为漏洞。

来源:TechCrunch AI

01:30

实时更新 CES 2025:Nvidia 后续动态及 Linda Yaccarino 主题演讲,展会现场开启

Nvidia 在 CES 2025 上推出 Project Digits,一款个人 AI 超级计算机,搭载 Grace Blackwell 超级芯片,支持运行高达 2000 亿参数的模型。该设备旨在降低高性能 AI 计算的门槛,推动 AI 技术在边缘计算和个性化应用中的普及。同时,May Mobility 展示了电动自动驾驶小巴,进一步扩展 AI 在交通领域的落地场景。这些创新标志着 AI 技术向更高效、更普惠的方向发展,同时加速了 AI 在消费级和行业级应用的商业化进程。

来源:TechCrunch AI

1月 4日
1 条新闻
00:00

微软计划在2025财年投入800亿美元用于人工智能数据中心

微软计划在2025财年投入800亿美元建设AI数据中心,主要用于训练AI模型和部署全球AI及云应用。其中超半数投资将用于美国,旨在推动AI技术创新和生产力提升。微软与OpenAI正合作开发名为Stargate的AI超级计算机数据中心,预计耗资超1000亿美元。此举凸显AI对算力和电力的巨大需求,可能引发数据中心电力短缺问题,同时也标志着AI基础设施建设的全球竞争加剧。

来源:TechCrunch AI