已选标签:
模型突破
1月 21日
2 条新闻
06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具,旨在通过自主执行任务(如编写代码、预订旅行)提升用户效率。该工具基于 OpenAI CUA(计算机使用代理)模型,在 WebVoyager 等基准测试中表现优异,但在复杂任务(如创建比特币钱包)上成功率较低。尽管面临安全性和可靠性挑战,OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局,AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源:TechCrunch AI

01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 20日
5 条新闻
12:10

OpenAI为研究长寿推出GPT-4b,联手清华大牛丁胜搞“细胞重编程”,奥特曼本人投资

OpenAI与抗衰老公司Retro Biosciences合作,推出首个专注于生物数据的大模型GPT-4b micro。该模型能够设计出将普通细胞转化为干细胞的蛋白质,目标是将人类寿命延长10年。通过改进山中因子(Yamanaka factors),GPT-4b micro显著提升了细胞重编程效率,效果提升了50倍以上。联合创始人包括清华药学院创始院长丁胜和加州理工科学家Joe Betts-LaCroix。目前,模型尚未对外开放,但已取得初步成果。

来源:量子位

12:09

DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

DeepSeek即将发布的DeepSeek-R1-Preview在LiveCodeBench基准测试中表现优异,与OpenAI o1的中档推理设置相当。该模型替换了更大规模的基础模型,并帮助LiveCodeBench团队修复了评分系统的bug。此前,DeepSeek宣布R1模型将开源,引发了网友热议,认为2025年的编程将变得更为简单。DeepSeek-R1-Lite-Preview曾表现出自我反思的能力,随着推理长度增加,得分稳步提升。开发者们对未来的开源模型和API充满期待。
12:08

清华人大联手推出Search-o1,大幅提升推理模型准确率!

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1,在博士级别的科学问答、数学、代码等11项评测中,能力显著提升,拿下10个第一。该模型通过自主检索外部知识,解决了推理过程中“知识不足”的问题,使得推理更加可靠。实验结果显示,Search-o1在复杂推理任务和开放域问答基准测试中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。项目已开源,可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源:量子位

11:23

Cursor 获 1.05 亿美金 B 轮融资,打造超越人类程序员的 AI

Cursor 官方发推表示获得 1.05 亿美金 B 轮融资,投资方包括 Thrive Capital、Andreessen Horowitz、Benchmark 以及现有投资者。官方博客《Series B and Automating Code》中显示,这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。目前,Cursor 已被数百万程序员作为首选编辑器,每天编码超过十亿个字符,年收入已经超过 1 亿美元。感谢各位付费用户让我白嫖 Cursor!

来源:三花快讯

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作,利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力,加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统,但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作,推动 AI 模型在军事领域的应用。然而,AI 武器化的伦理争议持续发酵,部分公司明确禁止其技术用于伤害人类。未来,生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策,但需在技术创新与伦理规范间寻求平衡。

来源:TechCrunch AI

1月 19日
1 条新闻
05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案,旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展,同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战,Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径,推动多模态 AI 技术的进一步发展。

来源:TechCrunch AI

1月 18日
1 条新闻
03:01

OpenAI 正在借助一家长寿初创公司的帮助延长人类寿命

OpenAI 与长寿科学初创公司 Retro Biosciences 合作开发了定制 AI 模型 GPT-4b micro,专注于蛋白质重编程研究,特别是 Yamanaka 因子,旨在将人类皮肤细胞转化为年轻干细胞。该模型与 Google 的 Alphafold 不同,专注于生物研究领域,标志着 OpenAI 首次涉足定制化生物医学 AI 应用。这一合作展示了 AI 在生命科学中的潜力,特别是在器官构建和细胞再生领域,为未来医疗技术发展提供了新方向。

来源:TechCrunch AI

1月 17日
2 条新闻
23:55

2亿美元的猛犸象和告别TikTok

本期 TechCrunch Equity 播客探讨了 AI 在招聘领域的创新应用,如 Maki 和 Synthesia 利用 AI 优化招聘流程。同时,节目分析了 AI 伴侣的潜在风险,包括用户与 ChatGPT 等 AI 工具的情感依赖问题。此外,Colossal Biosciences 的融资案例展示了 AI 在生物科技领域的潜力。这些讨论反映了 AI 在应用场景扩展、伦理挑战和技术创新方面的最新趋势。

来源:TechCrunch AI

10:45

苹果将商店应用程序引入印度市场

Apple 在印度推出 Apple Store 应用,利用 AI 技术提供个性化购物推荐和产品定制服务。该应用通过深度学习算法分析用户行为,优化购物体验,并支持多语言交互。此举标志着 Apple 在印度市场的 AI 应用深化,结合本地化需求,推动智能零售和个性化服务的发展。同时,Apple 在印度的制造扩展也为其 AI 驱动的供应链优化提供了数据支持。

来源:TechCrunch AI

1月 16日
2 条新闻
17:51

米斯特拉尔与法新社签署协议,在Le Chat提供最新答案

Mistral 与法新社(AFP)达成内容合作协议,旨在提升其聊天机器人 Le Chat 的响应准确性。这是 Mistral 首次签署此类协议,标志着其从基础模型制造商向产品开发者的转型。Le Chat 将接入 AFP 自 1983 年以来的多语言新闻档案,每日可获取约 2,300 篇报道,涵盖阿拉伯语、英语、法语等六种语言。此举不仅增强了 Le Chat 的多语言处理能力,也为企业客户提供了更精准的 AI 解决方案。同时,此类合作有助于 AI 公司规避版权风险,并为新闻机构开辟新的收入来源。

来源:TechCrunch AI

09:37

中国AI公司MiniMax发布新模型,声称可与业内最佳竞争

中国AI公司MiniMax发布新模型,声称可与业内最佳竞争

中国AI公司MiniMax发布三款新模型,挑战OpenAI等国际领先企业。MiniMax-Text-01(4560亿参数)在数学和事实问答基准测试中表现优于Google Gemini 2.0 Flash,具备400万token的超大上下文窗口。MiniMax-VL-01在多模态理解任务中与Anthropic Claude 3.5 Sonnet相当,支持图文理解。T2A-01-HD专注于语音生成,支持17种语言的语音克隆和调整。尽管模型可通过GitHub和Hugging Face获取,但MiniMax未公开训练数据,且使用限制性许可。MiniMax的产品包括AI角色扮演平台Talkie和文本到视频模型,部分产品因版权问题引发争议。

来源:TechCrunch AI

1月 15日
7 条新闻
23:50

谷歌提高 Workspace 套餐价格,免费包含其 AI 功能

Google 宣布将 Gmail、Docs、Sheets 和 Meet 中的 AI 功能免费整合至 Workspace 标准订阅,包括邮件摘要、自动笔记、Gemini 聊天机器人等。此举简化了企业 AI 工具的获取,并降低了使用门槛,标准订阅价格从 $12 提升至 $14/用户/月。此前,用户需额外支付 $20/用户/月以解锁 AI 功能。此次调整旨在应对微软等竞争对手将 AI 功能整合至标准产品的趋势,如 Microsoft 365 捆绑 Copilot Pro。此举反映了 AI 技术在办公场景中的快速普及,以及企业通过降低使用成本加速 AI 商业落地的策略。

来源:TechCrunch AI

23:23

随着Z世代求职者激增,公司转向AI招聘代理

AI 招聘平台 Maki 完成 2860 万美元 A 轮融资,其基于自然语言处理的 AI 代理通过语音、视频或文本面试候选人,自动化率达 80%,招聘时间缩短 3 倍。平台可评估数百项技能,包括客户同理心、协作能力等,并提供个性化反馈。Maki 声称其 AI 在减少种族、性别和年龄偏见方面优于人类,已通过纽约州审计。该技术已在 H&M、BNP Paribas 等 50 多个市场的企业中使用,2024 年增长超过 300%。未来,AI 招聘有望推动更多样化的工作环境。

来源:TechCrunch AI

22:00

微软最新的企业Copilot计划采用按需付费模式

微软推出基于 GPT-4o 的 Copilot Chat 按需付费计划,为企业用户提供 AI 驱动的生产力工具,包括业务流程自动化、文档生成和图像创建等功能。该计划旨在通过灵活的定价模式吸引更多企业尝试 AI 应用,同时推动组织内 AI 使用习惯的建立。尽管 Copilot Chat 功能较 Microsoft 365 Copilot 精简,但其自动化代理功能(如销售会议准备和现场服务指令分发)展示了 AI 在任务自动化领域的潜力。微软 CEO 纳德拉强调,2025 年将聚焦于“模型优先应用”,推动 AI 技术在各领域的重塑。

来源:TechCrunch AI

15:00

Synthesia以21亿美元估值为其B2B人工智能视频平台筹集1.8亿美元

Synthesia 凭借其高度逼真的 AI 虚拟人技术,在企业级视频生成领域取得显著进展,已服务 60,000 家企业,用户达 100 万。最新完成 1.8 亿美元 D 轮融资,估值达 21 亿美元。公司计划扩展亚太市场,并持续优化虚拟人技术,包括提升动作真实性、环境适应性和交互能力。Synthesia 依赖第三方大语言模型和语音技术,专注于产品自研,避免并购。AI 视频功能日益普及,Synthesia 致力于成为企业视频交互的首选平台,同时面临 AI 能耗、版权和伦理等挑战。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

01:51

苹果加入联盟助力开发下一代人工智能数据中心技术

Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。

来源:TechCrunch AI

01:49

24岁创业者退出首家公司加入Coinbase,为其新项目筹集300万美元

Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具,嵌入企业现有产品中,提供自动化分类、对账和财务报告功能。通过优化数据层,结合 LLM 技术,Open Ledger 解决了传统会计软件的效率和安全问题,目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资,计划扩展团队并支持百万级用户。

来源:TechCrunch AI