AI视野:阿里开源AnyText;Pika推出付费计划;阿里推文生3D数字人项目;Magnific AI图片分辨率扩大至10K*10K

AI视野:阿里开源AnyText;Pika推出付费计划;阿里推文生3D数字人项目;Magnific AI图片分辨率扩大至10K*10K

    正在检查是否收录...

????大模型动态

阿里开源AnyText

阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。

英伟达推新AI语音识别模型Parakeet

NVIDIA NeMo宣布推出Parakeet ASR模型系列,这是一系列先进的自动语音识别(ASR)模型,与Suno.ai合作开发。

???AI应用

视频生成工具Pika推出付费计划,提供不同档次选择

Pika宣布推出付费计划,分为两个档次,分别为10美元和60美元。免费版本有水印,300积分生成60个视频,而付费版本消除水印,10美元版本可生成210个视频,60美元版本提供500个视频生成数量和额外功能。用户可根据需求选择不同档次,享受Pika提供的优质服务。

Magnific AI本周更新!可将图片放大至10K*10K分辨率

AI创始人Javi Lopez在推特宣布,Magnific AI将于本周更新,可将图片放大至10K*10K分辨率。

强大人工智能编码助手code AI

code AI是一款强大的人工智能编码助手,结合了机器学习技术和编程知识,自动分析代码结构并提供智能建议,支持多种编程语言和环境。

ComfyUI工作流管理插件Comfyspace更新

Comfyspace是一款实用的工作流管理插件,最新更新功能更强大,基本解决了工作流管理和使用的问题。

AI通话服务Bland 半秒响应,可同时进行50万个通话

Bland是一个AI通话服务,它支持半秒响应。它能够稳定地匹配人类的速度和质量,为用户带来最快的沟通体验。

???AI新鲜事

阿里推文生3D数字人项目Make-A-Character

阿里通义实验室XR实验室推出Make-A-Character项目,能从文字快速生成3D数字人。

雷军称小米汽车全身都是先进AI科技

雷军在微博上表示,小米汽车几乎全身都是先进AI科技,V8s也已实现量产,预计2025年上车。

初创公司Nation A发布Neuroid,革新生成式人工智能技术用于3D动画制作

Nation A公司推出Neuroid,一项生成式人工智能技术,可根据文本提示生成人形角色和四条腿的动物的3D动画,显著缩短动画制作时间。

?‍???聚焦开发者

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

近日,来自得克萨斯农工大学等机构的华人学者们发布了全新的大模型窗口扩展方法SelfExtended(简称SE)。无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!

Colossal-AI团队开源了SwiftInfer

Colossal-AI团队开源了SwiftInfer,实现了无限流式输入推理,成功提升了大模型推理性能46%,为多轮对话场景提供高效可靠的落地方案。

大模型人工智能工作流工作流管理智能编码asr动画制作3d动画roicode编码助手生成式人工智能生成式视频生成语音识别图片放大数字人人工智能技术智能技术自动语音识别ai应用付费版可自定义模型推理免费版url创始人多轮对话生成工具文字生成git智能建议文本提示上下文ai语音提示生成comfyui初创公司自定义github快速生成开发者多语言机器学习
  • 本文作者:李琛
  • 本文链接: https://wapzz.net/post-5260.html
  • 版权声明:本博客所有文章除特别声明外,均默认采用 CC BY-NC-SA 4.0 许可协议。
本站部分内容来源于网络转载,仅供学习交流使用。如涉及版权问题,请及时联系我们,我们将第一时间处理。
文章很赞!支持一下吧 还没有人为TA充电
为TA充电
还没有人为TA充电
0
  • 支付宝打赏
    支付宝扫一扫
  • 微信打赏
    微信扫一扫
感谢支持
文章很赞!支持一下吧
关于作者
2.3W+
5
0
1
WAP站长官方

解锁“文心一言”赋能大型连锁商超密码

上一篇

AI解读视频张口就来?这种「幻觉」难题Vista-LLaMA给解决了

下一篇
  • 复制图片
按住ctrl可打开默认菜单