已选标签:
生成模型
行业挑战
AI绘画
1月 20日
4 条新闻
13:49

通义:一分钟生成互动2D卡通角色,Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。

来源:github

11:23

MangaNinja:开源线稿上色工具

MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo。

来源:三花快讯

11:23

黑森林实验室推出 FLUX Pro Finetuning API:轻松定制你的图像模型

黑森林实验室(Black Forest Labs)最新发布的 FLUX Pro Finetuning API,让任何人都能轻松使用自己的图片来定制 FLUX Pro 模型。 这个 API 的亮点在于它的易用性和灵活性,最简单的例子就是你可以把你的 logo 融入生成的图像中,实现营销和推广。想了解更多详情,可以查看官方博客。

来源:三花快讯

1月 19日
1 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

1月 15日
3 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

1月 14日
2 条新闻
10:46

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion:2.5 天低成本训练 11.6 亿参数扩散模型

micro_diffusion 是一个开源方法,旨在通过充分利用每一刀从零开始训练大规模扩散模型。

任何人只需使用 8 个 H100 GPU,在短短 2.5 天内,就能以 1890 美元的超低成本,用 3700 万张公开可用的真实和合成图像,训练出一个 11.6 亿参数的稀疏 Transformer。

这比 Stable Diffusion 的训练成本低 118 倍!不过,从论文的基准测试来看,模型生成的图片质量仅略优于 SD1.5,放到现在可能有点不够看。

来源:三花快讯

01:00

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 获得 a16z 2400万美元投资,加速时尚设计进程

Raspberry AI 利用生成式 AI 技术革新时尚设计流程,通过其文本到图像平台,设计师能够快速可视化和迭代设计理念。该平台基于 OpenAI 的 DALL-E 和 Stability AI 的 Stable Diffusion 等图像模型,显著缩短了传统设计周期,从数周缩短至即时生成。Raspberry AI 的独特之处在于其能够准确理解行业特定术语,并支持从草图生成逼真图像,帮助品牌快速决策。公司已获得 2400 万美元 A 轮融资,计划扩展至家居、家具和化妆品设计领域。

来源:TechCrunch AI

1月 13日
4 条新闻
09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

1月 11日
1 条新闻
23:00

英伟达的AI帝国:聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。

来源:TechCrunch AI

1月 8日
1 条新闻
06:46

2025 CES 第一天:本田、宝马、X 的胜利时刻,以及首批展厅小工具揭晓

CES 2025 展示了 AI 技术在多个领域的创新应用。Nvidia 的生成式世界模型仿真工具 Cosmos 和云端 AI 超算平台被 Uber 用于自动驾驶技术开发,突显了生成式 AI 在复杂场景模拟中的潜力。BMW 推出基于 AI 的车载界面定制系统,通过屏幕反射实现挡风玻璃显示,展示了 AI 在智能座舱中的创新应用。此外,Acer 和 Razer 推出的游戏设备也体现了 AI 在增强用户体验方面的作用。这些进展表明,AI 正加速渗透到汽车、游戏和消费电子等领域,推动技术融合与产业升级。

来源:TechCrunch AI

1月 7日
1 条新闻
12:19

英伟达发布自有品牌的全球模型

英伟达发布自有品牌的全球模型

Nvidia 在 CES 2025 上发布了 Cosmos World Foundation Models (Cosmos WFMs),这是一系列基于物理感知的视频预测与生成的世界模型。这些模型分为 Nano、Super 和 Ultra 三类,参数规模从 40 亿到 140 亿不等,适用于低延迟、高性能和高保真输出场景。Cosmos WFMs 可用于生成合成数据,支持自动驾驶、机器人等领域的模型训练。Nvidia 还提供了上采样模型、增强现实视频解码器和安全护栏模型,确保负责任的使用。模型训练基于 9000 万亿 token 的多样化数据,涵盖人类交互、环境和工业场景。尽管存在版权争议,Nvidia 强调其数据使用符合法律精神。Cosmos WFMs 的开放性和可定制性为物理 AI 研究和开发提供了强大工具。

来源:TechCrunch AI

1月 4日
1 条新闻
00:00

生成式人工智能投资在2024年达到新高

2024 年生成式 AI 投资创历史新高,全球融资达 560 亿美元,同比增长 192%。OpenAI、Anthropic、xAI 等头部企业持续获得大额融资并推出创新产品。美国公司占据主导地位,但中国、欧洲等地也有 Moonshot AI、Mistral 等企业获得显著投资。生成式 AI 在编程助手、媒体创作等垂直领域竞争加剧,但技术挑战和高计算成本可能限制中小企业的持续创新。基础设施层企业(如数据中心)受益显著,预计全球 AI 数据中心年支出将达 2500 亿美元。未来,行业可能面临估值泡沫和技术瓶颈的双重挑战。

来源:TechCrunch AI