«

AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

WAP站长网 发布于 阅读:3 近日焦点


欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品

点击了解

:https://app.aibase.com/zh

1、蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

蚂蚁百灵团队开源了高性能思考模型 Ring-flash-2.0,该模型在多个高难度基准测试中表现出色,具有强大的计算能力和资源效率。其创新的两阶段强化学习训练流程提升了模型的推理能力,并且所有模型权重和训练方案都将完全开源。

AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

【AiBase提要:】

🧠 Ring-flash-2.0 是基于 Ling-flash-2.0-base 的高性能思考模型,参数总量为100亿,但每次推理仅激活6.1亿。

🚀 在数学竞赛、代码生成和逻辑推理等任务中,Ring-flash-2.0 的性能超越了同类40亿参数模型,甚至可与更大规模的开源稀疏模型媲美。

🔧 团队设计了创新的两阶段强化学习训练流程,包括 Long-CoT SFT、RLVR 和 RLHF,以提升模型的推理和通用能力。

详情链接:https://huggingface.co/inclusionAI/Ring-flash-2.0 https://modelscope.cn/models/inclusionAI/Ring-flash-2.0

2、阿里通义7款模型屠榜Hugging Face!全模态大模型Qwen3-Omni登顶全球第一

阿里通义7款模型在Hugging Face全球开源模型榜单中表现卓越,其中Qwen3-Omni作为全模态大模型,凭借强大的音视频处理能力和稳定的文本与图像性能,成功登顶全球第一。

【AiBase提要:】

🧠 Qwen3-Omni是阿里最新开源的全模态大模型,可处理文本、图片、语音和视频四种数据类型。

🎧 Qwen3-Omni在音视频能力上取得32项开源最佳性能SOTA,同时保持文本与图像性能稳定。

🚀 阿里通义7款模型包揽Hugging Face全球前十开源模型榜单,Qwen3-Omni登顶全球第一。

3、不只是生成视频:谷歌 Veo3视觉能力升级,可自动玩数独、解迷宫

谷歌研究部门最新披露,其视频生成模型 Veo3 在视觉AI领域取得了突破性进展,被誉为达到了‘GPT-3’时刻。Veo3不仅限于视频生成,还能在无需额外训练的情况下,自动完成多项复杂的视觉任务,包括寻找物体、修复照片、玩迷宫、解决数独等,标志着视觉AI进入新的发展阶段。

AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

【AiBase提要:】

🧠 理解图像:自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。

🧪 理解物理原理:具备基本的物理认知,例如能够分辨出哪些物体会漂浮,哪些会下沉,并理解光的反射方式。

🎨 进行手动编辑:像“自动版 Photoshop”一样,Veo3可以执行复杂的图片编辑任务,如去除背景、添加文字,甚至将照片转换为油画风格。

4、特斯拉全力推进“擎天柱”规模化生产,马斯克称其将成公司最重要产品

特斯拉正在全力推进其人形机器人“擎天柱”的规模化生产,并将其视为公司最重要的产品。尽管在研发过程中面临一些技术挑战,如手部设计问题,但特斯拉仍致力于克服这些障碍以实现量产目标。

AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

【AiBase提要:】

🤖 特斯拉正全力推进‘擎天柱’的规模化生产。

💡 马斯克认为‘擎天柱’将成为特斯拉最重要的产品。

🔧 机器人手部设计是当前研发中的主要技术挑战之一。

5、马斯克再发怒!第六次起诉 OpenAI,指控窃取商业机密

马斯克再次起诉 OpenAI,指控其窃取商业机密并挖角核心员工,双方竞争加剧,可能影响 AI 行业未来走向。

【AiBase提要:】

🧠 OpenAI 被指控系统性挖角 xAI 核心员工并窃取商业机密。

🔒 诉状指出 OpenAI 诱导员工违反保密协议,获取源代码和数据中心战略计划。

⚖️ 马斯克称 OpenAI 的行为威胁 xAI 的创新与未来发展。

6、苹果悄然测试 “聊天机器人”,但暂不向公众开放!

苹果正在内部测试代号为 'Veritas' 的聊天机器人应用,用于验证新一代 Siri 技术。尽管苹果在 AI 领域已有布局,但其策略并未获得预期反响,用户对 Siri 的表现不满。苹果组建了新团队 AKI,专注于开发 AI 驱动的网页搜索工具,同时计划推出结合外部模型和自研技术的新 Siri(Project Linwood)。然而,苹果尚未计划将 Veritas 推向消费者市场。

【AiBase提要:】

🍎 苹果正在测试名为 'Veritas' 的聊天机器人应用,用于验证新一代 Siri 技术。

🤖 苹果组建了 'AKI' 团队,专注于开发 AI 驱动的网页搜索工具,以接近 ChatGPT 等竞争对手。

📈 新一代 Siri(Project Linwood)预计明年3月亮相,将结合外部模型和自研技术。

7、YouTube 音乐推出 AI 主播,打破音乐聆听的沉默

YouTube 音乐推出了名为 'Beyond the Beat' 的 AI 主播,旨在提升用户的聆听体验。该功能在播放音乐时插入相关的故事、趣闻和评论,增加互动性。尽管存在生成不准确信息的风险,但其潜力仍值得期待。

【AiBase提要:】

🎧 YouTube 音乐推出 AI 主播 'Beyond the Beat',提升用户聆听体验。

🗣️ AI 主播在播放音乐时插入故事、趣闻和评论,增强互动性。

⚠️ 该技术可能生成不准确信息,但仍有潜力带来惊喜体验。

8、LiquidAI 推出 Liquid Nanos 系列轻量级 AI 模型,优化边缘设备应用

LiquidAI 发布了专为边缘计算设备设计的轻量级 AI 模型 'Liquid Nanos',支持多种应用场景,如翻译、抽取、RAG、工具调用和数学推理。该系列提供350M 和1.2B 两种参数版本,并支持 GGUF 量化格式,优化性能与资源利用。首批12款任务专用模型已在 Hugging Face 上线,为开发者提供了丰富的工具选择。

AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

【AiBase提要:】

🌟 LiquidAI 推出了专为边缘设备设计的轻量级 AI 模型 'Liquid Nanos'。

📊 提供350M 和1.2B 两种参数版本,支持 GGUF 量化格式以优化性能。

🚀 首批12款任务专用模型已在 Hugging Face 上线,涵盖多种应用场景。

详情链接:https://huggingface.co/collections/LiquidAI/liquid-nanos-68b98d898414dd94d4d5f99a

ChatGPT源码推荐:

小狐狸ChatGPT付费创作系统完全开源源码

请先 登录 再评论