AI新闻 | AI 地带

标签筛选

已选标签:

模型突破

AI招聘

伦理争议

AI训练

1月 21日

2 条新闻

06:29

OpenAI的代理工具可能即将发布

OpenAI 即将发布名为 Operator 的 AI 代理工具，旨在通过自主执行任务（如编写代码、预订旅行）提升用户效率。该工具基于 OpenAI CUA（计算机使用代理）模型，在 WebVoyager 等基准测试中表现优异，但在复杂任务（如创建比特币钱包）上成功率较低。尽管面临安全性和可靠性挑战，OpenAI 强调其严格的安全测试流程。随着 Anthropic、Google 等竞争对手的入局，AI 代理市场预计到 2030 年将达到 471 亿美元。Operator 的发布标志着 AI 代理技术向更广泛应用场景迈进的里程碑。

来源：TechCrunch AI

01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1，声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数，支持自我事实核查，适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本，最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势，但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧，凸显中美在AI领域的竞争态势。

来源：TechCrunch AI

1月 20日

5 条新闻

12:10

OpenAI为研究长寿推出GPT-4b，联手清华大牛丁胜搞“细胞重编程”，奥特曼本人投资

OpenAI与抗衰老公司Retro Biosciences合作，推出首个专注于生物数据的大模型GPT-4b micro。该模型能够设计出将普通细胞转化为干细胞的蛋白质，目标是将人类寿命延长10年。通过改进山中因子（Yamanaka factors），GPT-4b micro显著提升了细胞重编程效率，效果提升了50倍以上。联合创始人包括清华药学院创始院长丁胜和加州理工科学家Joe Betts-LaCroix。目前，模型尚未对外开放，但已取得初步成果。

来源：量子位

12:09

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

DeepSeek即将发布的DeepSeek-R1-Preview在LiveCodeBench基准测试中表现优异，与OpenAI o1的中档推理设置相当。该模型替换了更大规模的基础模型，并帮助LiveCodeBench团队修复了评分系统的bug。此前，DeepSeek宣布R1模型将开源，引发了网友热议，认为2025年的编程将变得更为简单。DeepSeek-R1-Lite-Preview曾表现出自我反思的能力，随着推理长度增加，得分稳步提升。开发者们对未来的开源模型和API充满期待。

来源：量子位 | 公众号 QbitAI

12:08

清华人大联手推出Search-o1，大幅提升推理模型准确率！

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1，在博士级别的科学问答、数学、代码等11项评测中，能力显著提升，拿下10个第一。该模型通过自主检索外部知识，解决了推理过程中“知识不足”的问题，使得推理更加可靠。实验结果显示，Search-o1在复杂推理任务和开放域问答基准测试中表现优异，尤其在多跳QA任务上平均准确率提升了近30%。项目已开源，可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源：量子位

11:23

Cursor 获 1.05 亿美金 B 轮融资，打造超越人类程序员的 AI

Cursor 官方发推表示获得 1.05 亿美金 B 轮融资，投资方包括 Thrive Capital、Andreessen Horowitz、Benchmark 以及现有投资者。官方博客《Series B and Automating Code》中显示，这笔融资将用来打造一个比任何现有人类程序员都厉害的 AI 程序员。目前，Cursor 已被数百万程序员作为首选编辑器，每天编码超过十亿个字符，年收入已经超过 1 亿美元。感谢各位付费用户让我白嫖 Cursor！

来源：三花快讯

03:30

五角大楼表示人工智能正在加速其“杀伤链”

OpenAI、Anthropic 等 AI 开发商正与美国军方合作，利用生成式 AI 提升国防部的威胁识别、跟踪和评估能力，加速“杀伤链”执行效率。尽管 AI 未被直接用于武器系统，但其在战略规划和场景模拟中展现出显著优势。Meta、Anthropic 等公司与国防承包商合作，推动 AI 模型在军事领域的应用。然而，AI 武器化的伦理争议持续发酵，部分公司明确禁止其技术用于伤害人类。未来，生成式 AI 在军事领域的深入应用可能推动硅谷放宽 AI 使用政策，但需在技术创新与伦理规范间寻求平衡。

来源：TechCrunch AI

1月 19日

3 条新闻

23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明，尽管大语言模型（LLMs）在编程等任务中表现出色，但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型，发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时，倾向于从显性数据中推断，难以检索到更隐晦的历史知识。此外，模型在特定地区（如撒哈拉以南非洲）的表现较差，暗示训练数据可能存在偏差。研究指出，LLMs 在历史研究领域仍需改进，但未来有望辅助历史学家，特别是在扩展数据覆盖和增加问题复杂性方面。

来源：TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用，包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战，尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境，同时推动联邦学习等隐私保护技术的发展。

来源：TechCrunch AI

05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案，旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展，同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战，Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径，推动多模态 AI 技术的进一步发展。

来源：TechCrunch AI

1月 18日

1 条新闻

03:01

OpenAI 正在借助一家长寿初创公司的帮助延长人类寿命

OpenAI 与长寿科学初创公司 Retro Biosciences 合作开发了定制 AI 模型 GPT-4b micro，专注于蛋白质重编程研究，特别是 Yamanaka 因子，旨在将人类皮肤细胞转化为年轻干细胞。该模型与 Google 的 Alphafold 不同，专注于生物研究领域，标志着 OpenAI 首次涉足定制化生物医学 AI 应用。这一合作展示了 AI 在生命科学中的潜力，特别是在器官构建和细胞再生领域，为未来医疗技术发展提供了新方向。

来源：TechCrunch AI

1月 17日

2 条新闻

23:55

2亿美元的猛犸象和告别TikTok

本期 TechCrunch Equity 播客探讨了 AI 在招聘领域的创新应用，如 Maki 和 Synthesia 利用 AI 优化招聘流程。同时，节目分析了 AI 伴侣的潜在风险，包括用户与 ChatGPT 等 AI 工具的情感依赖问题。此外，Colossal Biosciences 的融资案例展示了 AI 在生物科技领域的潜力。这些讨论反映了 AI 在应用场景扩展、伦理挑战和技术创新方面的最新趋势。

来源：TechCrunch AI

10:45

苹果将商店应用程序引入印度市场

Apple 在印度推出 Apple Store 应用，利用 AI 技术提供个性化购物推荐和产品定制服务。该应用通过深度学习算法分析用户行为，优化购物体验，并支持多语言交互。此举标志着 Apple 在印度市场的 AI 应用深化，结合本地化需求，推动智能零售和个性化服务的发展。同时，Apple 在印度的制造扩展也为其 AI 驱动的供应链优化提供了数据支持。

来源：TechCrunch AI

1月 16日

2 条新闻

17:51

米斯特拉尔与法新社签署协议，在Le Chat提供最新答案

Mistral 与法新社（AFP）达成内容合作协议，旨在提升其聊天机器人 Le Chat 的响应准确性。这是 Mistral 首次签署此类协议，标志着其从基础模型制造商向产品开发者的转型。Le Chat 将接入 AFP 自 1983 年以来的多语言新闻档案，每日可获取约 2,300 篇报道，涵盖阿拉伯语、英语、法语等六种语言。此举不仅增强了 Le Chat 的多语言处理能力，也为企业客户提供了更精准的 AI 解决方案。同时，此类合作有助于 AI 公司规避版权风险，并为新闻机构开辟新的收入来源。

来源：TechCrunch AI

09:37

中国AI公司MiniMax发布新模型，声称可与业内最佳竞争

中国AI公司MiniMax发布新模型，声称可与业内最佳竞争

中国AI公司MiniMax发布三款新模型，挑战OpenAI等国际领先企业。MiniMax-Text-01（4560亿参数）在数学和事实问答基准测试中表现优于Google Gemini 2.0 Flash，具备400万token的超大上下文窗口。MiniMax-VL-01在多模态理解任务中与Anthropic Claude 3.5 Sonnet相当，支持图文理解。T2A-01-HD专注于语音生成，支持17种语言的语音克隆和调整。尽管模型可通过GitHub和Hugging Face获取，但MiniMax未公开训练数据，且使用限制性许可。MiniMax的产品包括AI角色扮演平台Talkie和文本到视频模型，部分产品因版权问题引发争议。

来源：TechCrunch AI

1月 15日

5 条新闻

23:50

谷歌提高 Workspace 套餐价格，免费包含其 AI 功能

Google 宣布将 Gmail、Docs、Sheets 和 Meet 中的 AI 功能免费整合至 Workspace 标准订阅，包括邮件摘要、自动笔记、Gemini 聊天机器人等。此举简化了企业 AI 工具的获取，并降低了使用门槛，标准订阅价格从 $12 提升至 $14/用户/月。此前，用户需额外支付 $20/用户/月以解锁 AI 功能。此次调整旨在应对微软等竞争对手将 AI 功能整合至标准产品的趋势，如 Microsoft 365 捆绑 Copilot Pro。此举反映了 AI 技术在办公场景中的快速普及，以及企业通过降低使用成本加速 AI 商业落地的策略。

来源：TechCrunch AI

23:23

随着Z世代求职者激增，公司转向AI招聘代理

AI 招聘平台 Maki 完成 2860 万美元 A 轮融资，其基于自然语言处理的 AI 代理通过语音、视频或文本面试候选人，自动化率达 80%，招聘时间缩短 3 倍。平台可评估数百项技能，包括客户同理心、协作能力等，并提供个性化反馈。Maki 声称其 AI 在减少种族、性别和年龄偏见方面优于人类，已通过纽约州审计。该技术已在 H&M、BNP Paribas 等 50 多个市场的企业中使用，2024 年增长超过 300%。未来，AI 招聘有望推动更多样化的工作环境。

来源：TechCrunch AI

22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司，旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库，专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长，Rockfish 通过技术差异化（如持续数据摄入）和高质量团队（多位数据科学博士）脱颖而出。该公司已获 600 万美元融资，客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长，合成数据领域竞争加剧，Tonic AI、Mostly AI 等公司也在积极布局。

来源：TechCrunch AI

22:00

微软最新的企业Copilot计划采用按需付费模式

微软推出基于 GPT-4o 的 Copilot Chat 按需付费计划，为企业用户提供 AI 驱动的生产力工具，包括业务流程自动化、文档生成和图像创建等功能。该计划旨在通过灵活的定价模式吸引更多企业尝试 AI 应用，同时推动组织内 AI 使用习惯的建立。尽管 Copilot Chat 功能较 Microsoft 365 Copilot 精简，但其自动化代理功能（如销售会议准备和现场服务指令分发）展示了 AI 在任务自动化领域的潜力。微软 CEO 纳德拉强调，2025 年将聚焦于“模型优先应用”，推动 AI 技术在各领域的重塑。

来源：TechCrunch AI

15:00

Synthesia以21亿美元估值为其B2B人工智能视频平台筹集1.8亿美元

Synthesia 凭借其高度逼真的 AI 虚拟人技术，在企业级视频生成领域取得显著进展，已服务 60,000 家企业，用户达 100 万。最新完成 1.8 亿美元 D 轮融资，估值达 21 亿美元。公司计划扩展亚太市场，并持续优化虚拟人技术，包括提升动作真实性、环境适应性和交互能力。Synthesia 依赖第三方大语言模型和语音技术，专注于产品自研，避免并购。AI 视频功能日益普及，Synthesia 致力于成为企业视频交互的首选平台，同时面临 AI 能耗、版权和伦理等挑战。

来源：TechCrunch AI

AI 地带(aididai.cn)导航收录了国内外数百个不同类型的AI工具，每日更新和添加最新AI工具，AI工具集还推荐了AI学习开发的常用网站、框架和模型，帮助你加入人工智能浪潮，自动化高效完成任务！ Ctrl + D 或 ⌘ + D 收藏本站到浏览器书签栏。

Copyright © 2023 AI 地带