已选标签:
多模态AI
AI视频
AI训练
1月 21日
1 条新闻
01:44

DeepSeek声称其推理模型在某些基准上超越了OpenAI的o1

中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。

来源:TechCrunch AI

1月 20日
7 条新闻
16:33

X 正在美国为用户推出专属的垂直视频信息流

社交平台 X 推出垂直视频专区,利用 AI 驱动的推荐算法优化用户体验。此举旨在填补 TikTok 等应用在美国市场的空缺,通过深度学习技术提升视频内容的分发效率和用户粘性。X 此前已推出独立电视应用,显示其在视频领域的持续布局。随着 Meta 等竞争对手推出类似功能,AI 驱动的视频推荐和编辑工具正成为社交平台竞争的关键技术。未来,多模态模型和个性化推荐算法的进一步融合将推动视频内容生态的智能化发展。

来源:TechCrunch AI

13:02

Bluesky推出垂直视频定制信息流

Bluesky 推出垂直视频定制 feed,利用其去中心化协议 AT Protocol 支持开发者构建 TikTok 替代应用,如 Tik.Blue 和 Skylight.Social。此举展示了 AI 驱动的个性化推荐技术在社交媒体中的应用,同时反映了去中心化社交平台的崛起。随着 TikTok 相关争议,Bluesky 用户增长至 2800 万,凸显了 AI 在内容分发和用户体验优化中的关键作用。Meta 和 X 也推出类似功能,表明 AI 驱动的视频内容竞争加剧。

来源:TechCrunch AI

12:08

清华人大联手推出Search-o1,大幅提升推理模型准确率!

清华和人大联合推出的新框架「Agentic搜索增强推理模型」Search-o1,在博士级别的科学问答、数学、代码等11项评测中,能力显著提升,拿下10个第一。该模型通过自主检索外部知识,解决了推理过程中“知识不足”的问题,使得推理更加可靠。实验结果显示,Search-o1在复杂推理任务和开放域问答基准测试中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。项目已开源,可在GitHub和抱抱脸获取。通讯作者为人大高瓴人工智能学院的窦志成教授。

来源:量子位

11:23

MangaNinja:开源线稿上色工具

MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo。

来源:三花快讯

01:53

TikTok 恢复在美国的服务

TikTok 在美国的服务中断事件凸显了 AI 技术在跨境数据安全和政策合规中的关键作用。作为依赖 AI 推荐算法的短视频平台,TikTok 的恢复运营依赖于政策明确性和技术基础设施的稳定性。事件反映了 AI 应用在全球化部署中面临的法律风险和算力保障挑战,同时也揭示了 AI 技术在中小企业赋能和用户行为分析中的商业价值。未来,AI 平台的可持续运营将更加依赖于技术创新与政策环境的协同发展。

来源:TechCrunch AI

01:53

TikTok 称正在美国恢复服务

TikTok 在美国恢复服务,凸显 AI 平台在数据安全和跨境运营中的挑战。事件涉及 AI 驱动的内容推荐算法和用户数据分析,强调了全球 AI 应用在政策合规性和技术供应链管理中的复杂性。未来,AI 平台需进一步优化联邦学习等技术,确保数据隐私与跨境合作的平衡,同时探索多模态模型在内容审核和个性化推荐中的创新应用。

来源:TechCrunch AI

1月 19日
3 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

15:56

苹果列出在美国与TikTok一同下架的所有应用

苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。

来源:TechCrunch AI

05:20

Perplexity AI 提交与 TikTok 合并的投标

Perplexity AI 提出与 TikTok 美国业务合并的提案,旨在通过整合 TikTok 的视频内容增强其 AI 搜索引擎的多模态能力。此举反映了 AI 技术在视频内容理解和搜索领域的应用扩展,同时凸显了 AI 企业在数据获取和商业落地中的战略布局。尽管面临监管挑战,Perplexity 的创新合并模式可能为 AI 与社交媒体融合开辟新路径,推动多模态 AI 技术的进一步发展。

来源:TechCrunch AI

1月 18日
1 条新闻
03:58

AI初创公司Character AI在网页上测试游戏

Character AI 正在测试基于其 AI 角色的游戏功能,旨在提升用户参与度。新推出的游戏 Speakeasy 和 War of Words 允许用户与现有角色互动,结合自然语言处理技术,增强娱乐体验。此举标志着 AI 从文本交互向多模态娱乐平台的扩展,展现了 AI 在游戏化应用中的潜力。公司定位为 AI 娱乐平台,强调安全性和用户体验,同时通过游戏化策略延长用户停留时间,日均使用时长达 98 分钟。

来源:TechCrunch AI

1月 17日
1 条新闻
17:58

Nord Security创始人推出Nexos.ai,助力企业将AI项目从试点推向生产

Nexos.ai 由 Nord Security 创始人创立,旨在帮助企业将 AI 项目从试点推向生产,重点关注大语言模型(LLMs)的可视化、安全性和适应性。通过单一 API,客户可访问 200 多个 AI 模型,支持在模型故障或成本过高时自动切换。Nexos.ai 引入智能缓存和严格的数据安全措施,优化成本并确保合规性。该平台解决了企业在 AI 部署中的高可用性、安全性和成本管理挑战,助力企业高效管理复杂的 AI 模型生态系统。

来源:TechCrunch AI

1月 16日
1 条新闻
09:37

中国AI公司MiniMax发布新模型,声称可与业内最佳竞争

中国AI公司MiniMax发布新模型,声称可与业内最佳竞争

中国AI公司MiniMax发布三款新模型,挑战OpenAI等国际领先企业。MiniMax-Text-01(4560亿参数)在数学和事实问答基准测试中表现优于Google Gemini 2.0 Flash,具备400万token的超大上下文窗口。MiniMax-VL-01在多模态理解任务中与Anthropic Claude 3.5 Sonnet相当,支持图文理解。T2A-01-HD专注于语音生成,支持17种语言的语音克隆和调整。尽管模型可通过GitHub和Hugging Face获取,但MiniMax未公开训练数据,且使用限制性许可。MiniMax的产品包括AI角色扮演平台Talkie和文本到视频模型,部分产品因版权问题引发争议。

来源:TechCrunch AI

1月 15日
6 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

15:00

Synthesia以21亿美元估值为其B2B人工智能视频平台筹集1.8亿美元

Synthesia 凭借其高度逼真的 AI 虚拟人技术,在企业级视频生成领域取得显著进展,已服务 60,000 家企业,用户达 100 万。最新完成 1.8 亿美元 D 轮融资,估值达 21 亿美元。公司计划扩展亚太市场,并持续优化虚拟人技术,包括提升动作真实性、环境适应性和交互能力。Synthesia 依赖第三方大语言模型和语音技术,专注于产品自研,避免并购。AI 视频功能日益普及,Synthesia 致力于成为企业视频交互的首选平台,同时面临 AI 能耗、版权和伦理等挑战。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

05:41

法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4

Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。

来源:TechCrunch AI

03:44

TikTok 用户尝试迁移到中国应用 RedNote 并不顺利

TikTok 用户尝试迁移到中国应用 RedNote 并不顺利

美国 TikTok 用户转向中国社交应用 RedNote(小红书),但其 AI 驱动的内容审核系统引发争议。用户因视频水印、验证问题或不明原因被禁,凸显了跨文化平台在 AI 内容管理中的挑战。RedNote 的多模态推荐算法结合短视频和本地服务,展示了 AI 在社交应用中的多样化应用,但其语言和文化适配问题暴露了全球化 AI 系统的局限性。

来源:TechCrunch AI