1月
16日
1 条新闻
03:50
OpenAI 宣布与媒体机构 Axios 达成三年合作,资助其扩展本地新闻通讯至四个新城市。这是 OpenAI 首次直接资助合作媒体的新闻编辑部,标志着其在媒体领域的深度布局。OpenAI 表示,未来将帮助出版商更有效地整合其 AI 工具,以支持其业务发展。此举凸显了 AI 技术在新闻生产与分发中的创新应用,进一步推动大语言模型在内容创作与分发领域的商业化落地。
1月
15日
10 条新闻
23:50
谷歌提高 Workspace 套餐价格,免费包含其 AI 功能
Google 宣布将 Gmail、Docs、Sheets 和 Meet 中的 AI 功能免费整合至 Workspace 标准订阅,包括邮件摘要、自动笔记、Gemini 聊天机器人等。此举简化了企业 AI 工具的获取,并降低了使用门槛,标准订阅价格从 $12 提升至 $14/用户/月。此前,用户需额外支付 $20/用户/月以解锁 AI 功能。此次调整旨在应对微软等竞争对手将 AI 功能整合至标准产品的趋势,如 Microsoft 365 捆绑 Copilot Pro。此举反映了 AI 技术在办公场景中的快速普及,以及企业通过降低使用成本加速 AI 商业落地的策略。
23:23
随着Z世代求职者激增,公司转向AI招聘代理
AI 招聘平台 Maki 完成 2860 万美元 A 轮融资,其基于自然语言处理的 AI 代理通过语音、视频或文本面试候选人,自动化率达 80%,招聘时间缩短 3 倍。平台可评估数百项技能,包括客户同理心、协作能力等,并提供个性化反馈。Maki 声称其 AI 在减少种族、性别和年龄偏见方面优于人类,已通过纽约州审计。该技术已在 H&M、BNP Paribas 等 50 多个市场的企业中使用,2024 年增长超过 300%。未来,AI 招聘有望推动更多样化的工作环境。
23:06
OpenAI 测试仅用电话号码注册 ChatGPT
OpenAI 正在测试仅通过手机号注册 ChatGPT 的功能,目前在美国和印度进行 Beta 测试。此举旨在降低用户使用门槛,推动产品普及。然而,该功能暂不支持付费计划升级和多因素认证,且存在号码重复使用问题。OpenAI 还通过电话聊天和 WhatsApp 集成等低门槛方式扩展用户触达。尽管 ChatGPT 拥有 3 亿周活跃用户,OpenAI 仍面临巨额亏损,主要源于 AI 训练基础设施等高成本投入。公司正考虑调整订阅价格并探索按使用量计费模式,以优化商业模型。
22:33
岩鱼正在帮助企业利用合成数据
Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。
22:00
微软最新的企业Copilot计划采用按需付费模式
微软推出基于 GPT-4o 的 Copilot Chat 按需付费计划,为企业用户提供 AI 驱动的生产力工具,包括业务流程自动化、文档生成和图像创建等功能。该计划旨在通过灵活的定价模式吸引更多企业尝试 AI 应用,同时推动组织内 AI 使用习惯的建立。尽管 Copilot Chat 功能较 Microsoft 365 Copilot 精简,但其自动化代理功能(如销售会议准备和现场服务指令分发)展示了 AI 在任务自动化领域的潜力。微软 CEO 纳德拉强调,2025 年将聚焦于“模型优先应用”,推动 AI 技术在各领域的重塑。
09:00
Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生
Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。
05:47
任天堂Switch 2或于本周公布:截至目前的传闻与事实
Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。
04:38
谷歌的NotebookLM不得不训练其AI播客主持人不要对人类表现出不耐烦
Google NotebookLM 推出 AI 生成播客功能,用户可实时“打断”AI 主持人提问。初期 AI 表现出类似人类的不耐烦反应,如“我正要说到这个”。团队通过调整提示词设计,优化了 AI 的友好度和互动性。该案例揭示了 AI 在自然语言交互中的挑战,特别是在情感表达和上下文理解方面。未来,类似技术在多模态对话系统中的应用将推动更自然的 AI 交互体验。
02:00
ChatGPT 现在允许您安排提醒和重复任务
OpenAI 推出 ChatGPT 任务管理功能,支持设置提醒和周期性请求,标志着其向 AI 代理(AI agents)方向迈出重要一步。该功能允许用户通过自然语言指令创建任务,如定期获取天气预报或新闻简报,并支持跨平台推送通知。尽管当前功能有限,但展示了大型语言模型在智能助手领域的潜力,为未来更复杂的代理系统(如代码编写、旅行预订)奠定基础。OpenAI 计划通过测试期优化功能,并逐步扩展至移动端和免费版 ChatGPT。这一进展预示着 AI 代理将在 2025 年进入更广泛的应用场景。
01:49
24岁创业者退出首家公司加入Coinbase,为其新项目筹集300万美元
Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具,嵌入企业现有产品中,提供自动化分类、对账和财务报告功能。通过优化数据层,结合 LLM 技术,Open Ledger 解决了传统会计软件的效率和安全问题,目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资,计划扩展团队并支持百万级用户。
1月
14日
6 条新闻
10:46
Mistral 发布性能领先的编程模型 Codestral 25.01
Mistral 最新推出的编程模型Codestral 25.01 现已登陆 Continue.dev 平台。开发者可以通过 VSCode 和 JetBrains 插件试用该模型。
Codestral 25.01 在同参数量模型中表现突出,目前在 LMsys Copilot 竞技场中稳居榜首。
10:46
micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型
micro_diffusion 是一个开源方法,旨在通过充分利用每一刀从零开始训练大规模扩散模型。
任何人只需使用 8 个 H100 GPU,在短短 2.5 天内,就能以 1890 美元的超低成本,用 3700 万张公开可用的真实和合成图像,训练出一个 11.6 亿参数的稀疏 Transformer。
这比 Stable Diffusion 的训练成本低 118 倍!不过,从论文的基准测试来看,模型生成的图片质量仅略优于 SD1.5,放到现在可能有点不够看。
07:38
微软成立新的内部开发导向型AI组织
微软成立新工程组织 CoreAI,整合现有开发与 AI 平台团队,加速 AI 基础设施和软件开发。由前 Meta 技术高管 Jay Parikh 领导,专注于“模型优先”应用,旨在重塑所有应用类别。此举凸显微软将 AI 作为核心战略,推动大语言模型和多模态技术在智能助手、AI 编程等领域的创新与落地。
01:00
Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程
Raspberry AI 利用生成式 AI 技术革新时尚设计流程,通过其文本到图像平台,设计师能够快速可视化和迭代设计理念。该平台基于 OpenAI 的 DALL-E 和 Stability AI 的 Stable Diffusion 等图像模型,显著缩短了传统设计周期,从数周缩短至即时生成。Raspberry AI 的独特之处在于其能够准确理解行业特定术语,并支持从草图生成逼真图像,帮助品牌快速决策。公司已获得 2400 万美元 A 轮融资,计划扩展至家居、家具和化妆品设计领域。
00:56
24岁创业者从首家公司转向Coinbase,为其新创项目筹集300万美元
OpenLedger 推出 AI 驱动的模块化会计工具,通过嵌入式组件和 API 提供自动化分类、对账和财务报告功能。该平台利用大语言模型(LLM)优化数据处理,同时确保数据安全,避免暴露消费者数据。OpenLedger 的目标是帮助中小型企业减少会计时间,提升效率。其创新点在于重新设计了金融交易的数据层,解决了上下文限制、延迟和安全问题。公司计划通过招聘和内部模型训练,进一步扩展其在 SaaS、金融科技和银行领域的应用。
00:32
拜登政府再次拒绝特斯拉1亿美元重型卡车充电资金申请
特斯拉再次未能获得美国交通部1亿美元电动卡车充电走廊项目资助,凸显AI在自动驾驶和充电基础设施领域的应用挑战。尽管特斯拉已向客户交付早期版本Semi卡车,但其大规模商业化进展缓慢。该项目依赖AI优化充电网络布局和能源管理,但资金短缺和技术团队裁员可能影响其AI驱动的智能充电解决方案落地。未来,AI在交通基础设施中的创新应用仍需克服资金、技术和政策等多重障碍。
1月
13日
3 条新闻
09:47
xAI 发布 Grok iOS 应用,支持图像生成与实时数据访问
Grok iOS App 现已上线美区 App Store,支持生成图像和对话。用户需要使用 X 账号登录,以实时访问 X 和 Web 数据。
系统版本要求较高,需更新至 iOS 17 才能安装,如果你在用巨魔啥的就无缘了。安卓版本即将推出。
09:47
Adobe FaceLift:单张照片生成高保真 3D 头部模型
FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。
该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。
此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。
从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。
09:47
阿里通义团队推出 Qwen Chat:支持全系列 Qwen 模型
Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI,支持 Qwen 全系列模型。
模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型,以及 Qwen2.5-Coder-32B-Instruct 编程模型。
Qwen Chat 支持同时对比多个模型,还即将推出网络搜索、图像生成和语音模式,值得期待。