Midjourney更新“room”、提供“sref代码、增加新的社区想法排行榜
🆕 群组创建房间升级:现在,拥有至少1000张图片的用户可以使用升级后的“群组创建房间”功能,该房间集成了聊天、图片分享、点赞和语音功能。
未来计划包括为语音聊天增加AI降噪功能,以及允许用户创建私人和公共房间。
“sref random”功能:提供了一个简单的“sref代码”,允许用户通过随机生成的代码回到特定的风格。
📊 社区想法排行榜更新:更新了算法,增加了“争议”度量,量化了“热心者”和“怀疑者”对某个想法重要性的不同看法。
https://alpha.midjourney.com/rooms/
中国首个Sora级视频大模型Vidu发布
🇨🇳 Vidu模型发布:生数科技与清华大学合作,在中关村论坛未来人工智能先锋论坛上正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。
📹 技术特点:Vidu模型融合了Diffusion与Transformer技术,创新性地创建了U-ViT架构。
支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
🌟 演示效果:官方宣传资料中展示了“画室中的一艘船驶向镜头”的效果,海浪和船的效果非常逼真。
🧠 技术优势:Vidu能够模拟真实物理世界,并且拥有丰富的想象力,具备多镜头生成和高时空一致性等特点。
https://shengshu.feishu.cn/share/base/form/shrcnybSDE4Id1JnA5EQ0scv1Ph
阿里巴巴宣布开源Qwen1.5系列中的首个千亿参数模型Qwen1.5-110B。
🔍 性能评估:Qwen1.5-110B在基础能力评估中与Meta的Llama3-70B相媲美,并在Chat评估中表现出色,包括MT-Bench和AlpacaEval 2.0。
📈 模型架构:Qwen1.5-110B采用了与其它Qwen1.5模型相同的Transformer解码器架构,并包含了分组查询注意力(GQA),提高了模型推理时的效率。
🌐 多语言支持:该模型支持32K tokens的上下文长度,并且是多语言的,能够支持包括英语、中文、法语、西班牙语、德语、俄语、日语、韩语、越南语和阿拉伯语在内的多种语言。
🆚 性能比较:与Meta的Llama3-70B和Mixtral-8x22B等最新的SOTA(State of the Art)语言模型相比,Qwen1.5-110B在基础能力方面至少与Llama-3-70B模型相媲美。
https://github.com/QwenLM/Qwen1.5.git
科技CEO们包括Altman加入美国政府AI安全委员会
🤖 CEO们加入由Mayorkas领导的政府AI安全委员会,旨在保护国家关键服务免受AI干扰。
🔍成员包括OpenAI、微软、谷歌、Nvidia等AI领域关键企业领袖。
🔐 AI既有服务潜力,也有误用风险。
🌐 委员会还包括Adobe、AMD、Delta Airlines等企业及民权倡导者、学者和公共官员。
https://www.axios.com/2024/04/25/openai-chris-lehane-ai-critical-infrastructure