已选标签:
生成模型
低成本训练
AI训练
数据优化
1月 21日
1 条新闻
01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 20日
2 条新闻
13:49

通义:一分钟生成互动2D卡通角色,Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。

来源:github

1月 19日
2 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

1月 15日
6 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI

00:45

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键

量子计算初创公司 SEEQC 宣布获得 3000 万美元融资,致力于通过芯片技术简化量子硬件复杂性,推动量子计算与经典计算的融合。SEEQC 与 Nvidia 合作开发超低延迟芯片间连接技术,旨在提升量子计算与 GPU 的协同效率,支持数据中心和企业级应用。量子计算有望加速新材料和药物研发,德国化工巨头 BASF 和 Merck 已参与 SEEQC 主导的 QuPharma 项目。SEEQC 的技术源于 Hypres 的成熟芯片制造能力,未来将加速商业化进程,推动量子计算在 AI 和数据中心领域的应用。

来源:TechCrunch AI

1月 14日
3 条新闻
18:26

Bioptimus筹集4100万美元开发“生物学领域的GPT”

法国 AI 初创公司 Bioptimus 获 4100 万美元融资,致力于开发生物学领域的基础 AI 模型。该模型旨在通过从分子到生物体的多模态数据中学习,模拟生物系统以预测疾病结果并加速药物研发。Bioptimus 已发布开源病理学基础模型 H-Optimus-0,并计划推出覆盖更广治疗领域的多模态模型。其技术挑战包括处理敏感临床数据、优化模型训练及扩展数据源。此举标志着 AI 在生物医学领域的深度应用,未来有望推动医疗、生物技术及化妆品等行业的创新突破。

来源:TechCrunch AI

10:46

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion 是一个开源方法,旨在通过充分利用每一刀从零开始训练大规模扩散模型。

任何人只需使用 8 个 H100 GPU,在短短 2.5 天内,就能以 1890 美元的超低成本,用 3700 万张公开可用的真实和合成图像,训练出一个 11.6 亿参数的稀疏 Transformer。

这比 Stable Diffusion 的训练成本低 118 倍!不过,从论文的基准测试来看,模型生成的图片质量仅略优于 SD1.5,放到现在可能有点不够看。

来源:三花快讯

01:00

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 利用生成式 AI 技术革新时尚设计流程,通过其文本到图像平台,设计师能够快速可视化和迭代设计理念。该平台基于 OpenAI 的 DALL-E 和 Stability AI 的 Stable Diffusion 等图像模型,显著缩短了传统设计周期,从数周缩短至即时生成。Raspberry AI 的独特之处在于其能够准确理解行业特定术语,并支持从草图生成逼真图像,帮助品牌快速决策。公司已获得 2400 万美元 A 轮融资,计划扩展至家居、家具和化妆品设计领域。

来源:TechCrunch AI

1月 13日
2 条新闻
09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

1月 12日
1 条新闻
05:30

研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型

UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。

来源:TechCrunch AI

1月 11日
1 条新闻
23:00

英伟达的AI帝国:聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。

来源:TechCrunch AI

1月 8日
2 条新闻
12:15

印度政府网站仍在将用户重定向至诈骗网站

印度政府网站持续被植入诈骗链接,暴露网络安全漏洞。AI 技术可在内容管理系统(CMS)安全防护中发挥关键作用,通过深度学习检测异常行为、强化学习优化防御策略,以及联邦学习保护数据隐私。未来,AI 驱动的自动化安全解决方案有望提升政府网站的安全性,减少人为漏洞。

来源:TechCrunch AI