已选标签:
生成模型
AI智能体
低成本训练
1月 21日
1 条新闻
06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具,旨在通过自主执行任务(如编写代码、预订旅行)提升用户效率。该工具基于 OpenAI CUA(计算机使用代理)模型,在 WebVoyager 等基准测试中表现优异,但在复杂任务(如创建比特币钱包)上成功率较低。尽管面临安全性和可靠性挑战,OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局,AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源:TechCrunch AI

1月 20日
7 条新闻
23:00

以下是企业风投在2025年希望支持的AI公司类型

2025年AI投资趋势聚焦于垂直领域应用与基础设施创新。VCs看好针对特定任务的AI解决方案,尤其是结合智能代理的模型,以推动企业数字化转型。重点领域包括:1)垂直行业工作流的生成式AI重构;2)AI驱动的安全与自动化创新;3)企业级AI基础设施,特别是边缘计算、推理优化和UI/UX演进。投资趋势强调从单一功能向平台化解决方案的转变,同时关注AI系统的可靠性与抗脆弱性设计。

来源:TechCrunch AI

13:49

通义:一分钟生成互动2D卡通角色,Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。

来源:github

12:08

清华人大联手推出Search-o1,大幅提升推理模型准确率!

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1,在博士级别的科学问答、数学、代码等11项评测中,能力显著提升,拿下10个第一。该模型通过自主检索外部知识,解决了推理过程中“知识不足”的问题,使得推理更加可靠。实验结果显示,Search-o1在复杂推理任务和开放域问答基准测试中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。项目已开源,可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源:量子位

11:23

Cursor 获 1.05 亿美金 B 轮融资,打造超越人类程序员的 AI

Cursor 官方发推表示获得 1.05 亿美金 B 轮融资,投资方包括 Thrive Capital、Andreessen Horowitz、Benchmark 以及现有投资者。官方博客《Series B and Automating Code》中显示,这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。目前,Cursor 已被数百万程序员作为首选编辑器,每天编码超过十亿个字符,年收入已经超过 1 亿美元。感谢各位付费用户让我白嫖 Cursor!

来源:三花快讯

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作,利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力,加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统,但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作,推动 AI 模型在军事领域的应用。然而,AI 武器化的伦理争议持续发酵,部分公司明确禁止其技术用于伤害人类。未来,生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策,但需在技术创新与伦理规范间寻求平衡。

来源:TechCrunch AI

01:53

TikTok 称正在美国恢复服务

TikTok 在美国恢复服务,凸显 AI 平台在数据安全和跨境运营中的挑战。事件涉及 AI 驱动的内容推荐算法和用户数据分析,强调了全球 AI 应用在政策合规性和技术供应链管理中的复杂性。未来,AI 平台需进一步优化联邦学习等技术,确保数据隐私与跨境合作的平衡,同时探索多模态模型在内容审核和个性化推荐中的创新应用。

来源:TechCrunch AI

1月 19日
1 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

1月 18日
2 条新闻
09:41

电动汽车初创公司Canoo申请破产并停止运营

电动汽车初创公司 Canoo 因资金链断裂申请破产,凸显了 AI 技术在自动驾驶和智能电动汽车领域的商业化挑战。Canoo 曾开发模块化电动汽车平台,采用线控转向等先进技术,并尝试与苹果等科技巨头合作。然而,公司在技术落地、成本控制和商业模式上屡次调整,最终未能实现规模化生产。这一案例反映了 AI 驱动的新兴产业在技术研发与商业落地之间的平衡难题,尤其是在高投入、长周期的自动驾驶领域。

来源:TechCrunch AI

08:09

亚马逊在美国的无人机配送业务因测试设施发生坠机事故而暂停

亚马逊因无人机测试事故暂停 Prime Air 项目,凸显 AI 在自动驾驶和物流领域的应用挑战。事故涉及恶劣天气下的飞行稳定性及多机协同问题,需通过软件更新优化飞行控制算法。该项目旨在实现大规模无人机配送,但面临技术可靠性、安全性和运营效率等多重考验。此次事件反映了 AI 系统在复杂环境中的性能局限,以及强化学习与多模态感知技术在无人机领域的应用潜力与改进空间。

来源:TechCrunch AI

1月 17日
3 条新闻
17:58

Nord Security创始人推出Nexos.ai,助力企业将AI项目从试点推向生产

Nexos.ai 由 Nord Security 创始人创立,旨在帮助企业将 AI 项目从试点推向生产,重点关注大语言模型(LLMs)的可视化、安全性和适应性。通过单一 API,客户可访问 200 多个 AI 模型,支持在模型故障或成本过高时自动切换。Nexos.ai 引入智能缓存和严格的数据安全措施,优化成本并确保合规性。该平台解决了企业在 AI 部署中的高可用性、安全性和成本管理挑战,助力企业高效管理复杂的 AI 模型生态系统。

来源:TechCrunch AI

09:08

由于SpaceX星舰爆炸,FAA不得不改道航班

SpaceX Starship 测试飞行爆炸事件引发航空管制调整,凸显 AI 在空域管理与飞行安全中的潜在应用。事件中,FAA 通过实时数据分析与决策支持系统快速响应,调整航班航线与起降计划,展示了 AI 在复杂环境下的动态调度能力。未来,AI 技术有望进一步优化空域管理,提升飞行安全与效率,同时需解决数据实时处理与系统可靠性的技术挑战。

来源:TechCrunch AI

03:22

英伟达发布更多工具和防护措施,推动企业采用AI代理

Nvidia 推出三款新的 NIM 微服务,旨在增强企业级 AI 代理的安全性和可控性。这些服务包括内容安全防护、话题聚焦和防越狱功能,均集成于 Nvidia NeMo Guardrails 开源工具集中。通过轻量级专用模型的应用,Nvidia 填补了通用策略在复杂 AI 工作流中的安全漏洞。此举反映了企业对 AI 代理技术的谨慎态度,尽管市场预测显示未来几年 AI 代理的采用率将显著增长,但实际落地速度仍滞后于技术创新。Nvidia 希望通过此类工具降低企业采用 AI 技术的风险,推动更广泛的商业应用。

来源:TechCrunch AI

1月 15日
4 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

02:00

ChatGPT 现在允许您安排提醒和重复任务

ChatGPT 现在允许您安排提醒和重复任务

OpenAI 推出 ChatGPT 任务管理功能,支持设置提醒和周期性请求,标志着其向 AI 代理(AI agents)方向迈出重要一步。该功能允许用户通过自然语言指令创建任务,如定期获取天气预报或新闻简报,并支持跨平台推送通知。尽管当前功能有限,但展示了大型语言模型在智能助手领域的潜力,为未来更复杂的代理系统(如代码编写、旅行预订)奠定基础。OpenAI 计划通过测试期优化功能,并逐步扩展至移动端和免费版 ChatGPT。这一进展预示着 AI 代理将在 2025 年进入更广泛的应用场景。

来源:TechCrunch AI

1月 14日
2 条新闻
10:46

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion 是一个开源方法,旨在通过充分利用每一刀从零开始训练大规模扩散模型。

任何人只需使用 8 个 H100 GPU,在短短 2.5 天内,就能以 1890 美元的超低成本,用 3700 万张公开可用的真实和合成图像,训练出一个 11.6 亿参数的稀疏 Transformer。

这比 Stable Diffusion 的训练成本低 118 倍!不过,从论文的基准测试来看,模型生成的图片质量仅略优于 SD1.5,放到现在可能有点不够看。

来源:三花快讯

01:00

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 利用生成式 AI 技术革新时尚设计流程,通过其文本到图像平台,设计师能够快速可视化和迭代设计理念。该平台基于 OpenAI 的 DALL-E 和 Stability AI 的 Stable Diffusion 等图像模型,显著缩短了传统设计周期,从数周缩短至即时生成。Raspberry AI 的独特之处在于其能够准确理解行业特定术语,并支持从草图生成逼真图像,帮助品牌快速决策。公司已获得 2400 万美元 A 轮融资,计划扩展至家居、家具和化妆品设计领域。

来源:TechCrunch AI