AI日报：Kimi K2 高速版发布；美图WHEE上线视频超清功能；字节发布新模型Seed Diffusion Preview

正在检查是否收录...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品

点击了解

：https://top.aibase.com/

1、还原清晰美貌！美图WHEE“视频超清”功能正式上线

美图WHEE推出的“视频超清”功能通过AI技术显著提升了视频质量，无论是老视频还是模糊画面都能得到改善。用户只需上传视频即可一键修复，且提供限免体验以吸引更多用户使用。

【AiBase提要:】
🎥 修复视频质量，提升画面细节
🔄 一键操作，简单易用
💡 提供限免体验，吸引用户尝试

2、Kimi K2 高速版kimi-k2-turbo-preview发布输出每秒 40 Tokens

Kimi K2 高速版在保持与原版相同参数设置的基础上，显著提升了性能，输出速度从每秒10 Tokens提升至40 Tokens。官方还推出了限时5折优惠活动，吸引用户关注。

【AiBase提要:】
🚀 Kimi K2 高速版输出速度大幅提升，达到每秒40 Tokens。
💰 限时5折优惠活动，输入和输出价格极具竞争力。
💡 官方表示将持续优化模型，进一步提升性能。

3、通义千问开源Qwen3-Coder-Flash编程模型

Qwen3-Coder-Flash作为Qwen3-Coder系列的新成员，凭借卓越的性能和高效的运行速度，为编程领域带来了新的惊喜。它在代理式编程、浏览器使用和工具调用等领域展现出强大的Agent能力，同时支持大规模上下文理解，兼容性良好，适合多平台使用。

【AiBase提要:】
✨ Qwen3-Coder-Flash具备强大的Agent能力，适用于代理式编程、浏览器使用和工具调用等场景。
🧠 支持256K tokens的原生上下文理解，并可扩展至1M tokens，便于处理大型项目和复杂代码库。
🔧 兼容性强，支持多平台使用，并针对多个开发平台进行了优化，提升开发效率。
详情链接:https://www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct HF:https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct

4、Anthropic 超越 OpenAI 成为企业 AI 模型的新宠

文章指出，Anthropic 的 AI 模型在企业市场中已超越 OpenAI，反映出 AI 技术在商业应用中的快速变化。Anthropic 的市场份额从两年前的12%上升至32%，而 OpenAI 则从50%下降至25%。此外，企业在选择 AI 模型时更倾向于使用封闭模型，开源模型的使用率持续减少。

【AiBase提要:】
🚀 Anthropic 的市场份额达到32%，超越 OpenAI 的25%。
📉 OpenAI 市场份额自2023年以来显著下降，Anthropic 稳步增长。
🔒 企业更倾向于使用封闭模型，开源模型的使用率持续减少。

5、字节跳动发布实验性扩散语言模型 Seed Diffusion Preview

字节跳动Seed团队推出的Seed Diffusion Preview是一项重要的技术突破，通过离散扩散技术路线验证了下一代语言模型的可行性。该模型在推理速度和代码生成性能上表现出色，为自然语言处理领域带来了新的可能性。

【AiBase提要:】
🌱 Seed Diffusion Preview采用两阶段课程学习策略，提升局部上下文补全能力。
🔍 引入约束顺序扩散，引导模型掌握正确的代码依赖关系。
🚀 块级并行扩散采样方案实现高效块级推理，显著提升推理速度。
详情链接:https://seed.bytedance.com/seed_diffusion

6、马斯克宣布将向Grok Heavy用户推出视频生成器Imagine和AI虚拟男友Valentine

马斯克宣布将向 Grok Heavy 用户推出视频生成器 'Imagine' 和 AI 虚拟男友 'Valentine'，这两项技术可能改变数字互动方式，并引发对 AI 情感影响的思考。

【AiBase提要:】
🎥 通过简单指令或关键词，AI 可快速生成视频内容。
💬 AI 虚拟男友可模仿人类情感反应，提供陪伴与交流。
🤖 马斯克推出的产品引发关于 AI 对人类情感影响的讨论。

7、Quora的Poe平台推出开发者API

Quora 的 AI 平台 Poe 推出了一个开发者 API，旨在帮助开发者轻松接入各种 AI 模型或机器人，为他们的应用提供强大的 AI 功能。该 API 不收取额外费用，使用通过 Poe 的积分订阅计划进行追踪。Poe 提供了多种订阅计划，并允许用户按需购买积分。此外，Poe 支持超过 100 种多模态模型，包括文本、图像、视频和语音生成模型。

【AiBase提要:】
🤖 Poe 推出开发者 API，助力 AI 模型接入与应用开发。
💰 积分订阅计划灵活，支持多种套餐和按需购买。
📈 超过 100 种多模态模型支持，涵盖文本、图像、视频和语音生成。

8、告别AI味审美！Black Forest Labs联手Krea开源FLUX.1-Krea模型，重新定义图像生成自然美学

文章介绍了Black Forest Labs与Krea合作推出的开源图像生成模型FLUX.1-Krea [dev]，该模型专注于解决AI生成图像中的人工痕迹问题，通过优化细节处理和美学表现，提升了图像的自然感和真实质感。同时，该模型基于FLUX开源生态系统，兼容性强，为开发者提供了便利，并推动了AI图像生成技术的进一步发展。

【AiBase提要:】
🌟 FLUX.1-Krea [dev]致力于消除AI生成图像中的人工痕迹，提升自然感和真实质感。
🎨 模型基于FLUX开源生态，兼容性强，降低了新技术的采用成本。
💡 引入人类反馈强化学习，使AI更符合人类审美标准，避免不自然效果。
详情链接:https://docs.comfy.org/tutorials/flux/flux1-krea-dev

9、Augment 推出全新 CLI 工具 Auggie，革新开发者工作流

Augment 推出了全新的 CLI 工具 Auggie，旨在提升开发者在终端环境中的工作效率，并与主流开发工具深度整合。Auggie 的上下文引擎能够理解整个代码库，提供智能化的代码生成和优化能力，同时支持企业级应用，实现从代码编写到问题跟踪的完整工作流。

【AiBase提要:】
✨ Auggie 是一款专为开发者设计的代理 CLI 工具，无缝融入开发工作流。
🧠 上下文引擎升级，能自主理解整个代码库，提升代码生成和优化能力。
💼 面向企业级 AI 编码解决方案，支持 GitHub、Jira 等平台的原生集成。
详情链接:https://www.augment.new/

10、MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者

MOSS-TTSD是清华大学语音与语言实验室联合多家机构打造的AI语音对话生成模型，具有高表现力和自然度，适用于播客、有声小说等场景，并支持超长语音生成和音色克隆。

【AiBase提要:】
🧠 MOSS-TTSD基于Qwen3-1.7B-base模型，采用离散化语音序列建模方法，实现中英双语高表现力对话语音生成。
🎧 支持最长960秒的超长语音生成，具备零样本音色克隆能力，可上传完整对话片段或单人音频实现双人语音克隆。
🚀 MOSS-TTSD在中文客观指标上领先开源模型MoonCast，同时提供GitHub和HuggingFace开源链接，便于开发者接入。
详情链接:https://github.com/OpenMOSS/MOSS-TTSD