已选标签:
AI训练
企业应用
低成本训练
AI智能体
1月 21日
2 条新闻
06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具,旨在通过自主执行任务(如编写代码、预订旅行)提升用户效率。该工具基于 OpenAI CUA(计算机使用代理)模型,在 WebVoyager 等基准测试中表现优异,但在复杂任务(如创建比特币钱包)上成功率较低。尽管面临安全性和可靠性挑战,OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局,AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源:TechCrunch AI

01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 20日
5 条新闻
23:00

以下是企业风投在2025年希望支持的AI公司类型

2025年AI投资趋势聚焦于垂直领域应用与基础设施创新。VCs看好针对特定任务的AI解决方案,尤其是结合智能代理的模型,以推动企业数字化转型。重点领域包括:1)垂直行业工作流的生成式AI重构;2)AI驱动的安全与自动化创新;3)企业级AI基础设施,特别是边缘计算、推理优化和UI/UX演进。投资趋势强调从单一功能向平台化解决方案的转变,同时关注AI系统的可靠性与抗脆弱性设计。

来源:TechCrunch AI

12:08

清华人大联手推出Search-o1,大幅提升推理模型准确率!

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1,在博士级别的科学问答、数学、代码等11项评测中,能力显著提升,拿下10个第一。该模型通过自主检索外部知识,解决了推理过程中“知识不足”的问题,使得推理更加可靠。实验结果显示,Search-o1在复杂推理任务和开放域问答基准测试中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。项目已开源,可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源:量子位

11:23

Cursor 获 1.05 亿美金 B 轮融资,打造超越人类程序员的 AI

Cursor 官方发推表示获得 1.05 亿美金 B 轮融资,投资方包括 Thrive Capital、Andreessen Horowitz、Benchmark 以及现有投资者。官方博客《Series B and Automating Code》中显示,这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。目前,Cursor 已被数百万程序员作为首选编辑器,每天编码超过十亿个字符,年收入已经超过 1 亿美元。感谢各位付费用户让我白嫖 Cursor!

来源:三花快讯

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作,利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力,加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统,但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作,推动 AI 模型在军事领域的应用。然而,AI 武器化的伦理争议持续发酵,部分公司明确禁止其技术用于伤害人类。未来,生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策,但需在技术创新与伦理规范间寻求平衡。

来源:TechCrunch AI

01:53

TikTok 称正在美国恢复服务

TikTok 在美国恢复服务,凸显 AI 平台在数据安全和跨境运营中的挑战。事件涉及 AI 驱动的内容推荐算法和用户数据分析,强调了全球 AI 应用在政策合规性和技术供应链管理中的复杂性。未来,AI 平台需进一步优化联邦学习等技术,确保数据隐私与跨境合作的平衡,同时探索多模态模型在内容审核和个性化推荐中的创新应用。

来源:TechCrunch AI

1月 19日
2 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

1月 18日
2 条新闻
09:41

电动汽车初创公司Canoo申请破产并停止运营

电动汽车初创公司 Canoo 因资金链断裂申请破产,凸显了 AI 技术在自动驾驶和智能电动汽车领域的商业化挑战。Canoo 曾开发模块化电动汽车平台,采用线控转向等先进技术,并尝试与苹果等科技巨头合作。然而,公司在技术落地、成本控制和商业模式上屡次调整,最终未能实现规模化生产。这一案例反映了 AI 驱动的新兴产业在技术研发与商业落地之间的平衡难题,尤其是在高投入、长周期的自动驾驶领域。

来源:TechCrunch AI

08:09

亚马逊在美国的无人机配送业务因测试设施发生坠机事故而暂停

亚马逊因无人机测试事故暂停 Prime Air 项目,凸显 AI 在自动驾驶和物流领域的应用挑战。事故涉及恶劣天气下的飞行稳定性及多机协同问题,需通过软件更新优化飞行控制算法。该项目旨在实现大规模无人机配送,但面临技术可靠性、安全性和运营效率等多重考验。此次事件反映了 AI 系统在复杂环境中的性能局限,以及强化学习与多模态感知技术在无人机领域的应用潜力与改进空间。

来源:TechCrunch AI

1月 17日
3 条新闻
17:58

Nord Security创始人推出Nexos.ai,助力企业将AI项目从试点推向生产

Nexos.ai 由 Nord Security 创始人创立,旨在帮助企业将 AI 项目从试点推向生产,重点关注大语言模型(LLMs)的可视化、安全性和适应性。通过单一 API,客户可访问 200 多个 AI 模型,支持在模型故障或成本过高时自动切换。Nexos.ai 引入智能缓存和严格的数据安全措施,优化成本并确保合规性。该平台解决了企业在 AI 部署中的高可用性、安全性和成本管理挑战,助力企业高效管理复杂的 AI 模型生态系统。

来源:TechCrunch AI

09:08

由于SpaceX星舰爆炸,FAA不得不改道航班

SpaceX Starship 测试飞行爆炸事件引发航空管制调整,凸显 AI 在空域管理与飞行安全中的潜在应用。事件中,FAA 通过实时数据分析与决策支持系统快速响应,调整航班航线与起降计划,展示了 AI 在复杂环境下的动态调度能力。未来,AI 技术有望进一步优化空域管理,提升飞行安全与效率,同时需解决数据实时处理与系统可靠性的技术挑战。

来源:TechCrunch AI

03:22

英伟达发布更多工具和防护措施,推动企业采用AI代理

Nvidia 推出三款新的 NIM 微服务,旨在增强企业级 AI 代理的安全性和可控性。这些服务包括内容安全防护、话题聚焦和防越狱功能,均集成于 Nvidia NeMo Guardrails 开源工具集中。通过轻量级专用模型的应用,Nvidia 填补了通用策略在复杂 AI 工作流中的安全漏洞。此举反映了企业对 AI 代理技术的谨慎态度,尽管市场预测显示未来几年 AI 代理的采用率将显著增长,但实际落地速度仍滞后于技术创新。Nvidia 希望通过此类工具降低企业采用 AI 技术的风险,推动更广泛的商业应用。

来源:TechCrunch AI

1月 15日
6 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

02:00

ChatGPT 现在允许您安排提醒和重复任务

ChatGPT 现在允许您安排提醒和重复任务

OpenAI 推出 ChatGPT 任务管理功能,支持设置提醒和周期性请求,标志着其向 AI 代理(AI agents)方向迈出重要一步。该功能允许用户通过自然语言指令创建任务,如定期获取天气预报或新闻简报,并支持跨平台推送通知。尽管当前功能有限,但展示了大型语言模型在智能助手领域的潜力,为未来更复杂的代理系统(如代码编写、旅行预订)奠定基础。OpenAI 计划通过测试期优化功能,并逐步扩展至移动端和免费版 ChatGPT。这一进展预示着 AI 代理将在 2025 年进入更广泛的应用场景。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI