前两天刚刚疯传的 Suno 挑战者、“音乐版 Sora”正式现真身:正式名称 Udio,已完全免费开放,每人每月有足足 1200 首额度,网友们都玩疯了。
![](https://q1.itc.cn/q_70/images03/20240413/abd68b44711f49dfacc4ea96d58547f3.png)
有人居然写了首催更阿尔特曼快点发布 GPT-5的金属作品。咳咳,更高能的甚至还创作出了脱口秀……!
创始人看完都直拍大腿:这绝对是我们意料之外的功能。场面之热闹,有了 Sora 诞生之时的感觉了。不仅各种风格要啥有啥(古典、流行、说唱、钢琴爵士、重金属等等),还支持多种语言,中文韩文歌也可以。
大家可以欣赏一下目前社区中最受欢迎(播放量 7.6 万)的这首抒情歌,全长 3 分 17 秒,相当娓娓动听。
![](https://q9.itc.cn/q_70/images03/20240413/a7f27d8de8fc4bf78428304c2c88db92.png)
由于玩的人太多,服务器一度被挤爆(现在 ok 了):
而质量之高,也让大名鼎鼎的播放器 Spotify 都直接被 cue 了:
趁你现在还买得起,赶紧把它买了吧。(手动狗头)
具体怎么个事儿?
音乐版 Sora 来了
如开头所见,网友们口中盛传的“音乐版 Sora”就是 Udio。它刚刚发布的是 Beta 版,背后模型为 v1 版本,后续还会快速迭代。
我们进入官网,完成注册即可免费使用:每人每个月最高可以创造 1200 首曲子。
具体玩法就是先输入文字,例如“a song about the experience of moving to a big city, heavy metal”。
然后系统会给你推荐一些建议标签,都是关于风格和流派的,随便选。至于歌词的话,可以自己写,也可以纯乐器,或者让 AI 帮你生成。
![](https://q0.itc.cn/q_70/images03/20240413/91508818e3a4477b82a595608abb2c04.png)
都设置好后即可点击“Create”,稍等个大约 1-2 分钟左右的时间,就会得到结果了。(ps.由于现在试玩的人还是很多,所以官方解释了一下这生成速度确实比正常要慢一些)
结果默认两首曲子 —— 歌名都帮你取好了。
![](https://q3.itc.cn/q_70/images03/20240413/513f3e0a16c140f7b7d1dc7f5cc92d77.png)
点击即可检验结果、查看歌词。
不满意的话还可以进行进一步编辑、扩展或者 remix。
其中扩展可以帮咱们把默认的 33 秒时长提高到 1 分钟甚至 3 分钟。
一切满意的话就可以点击“publish”发布到社区了。
![](https://q1.itc.cn/q_70/images03/20240413/69227d01f8f544ab8c50245056849115.png)
随便点了几首作品,真的都让人忍不住哇塞。这首欢快的“C 调 Allegro Consort”也必须给大家听一下:—— 这么好用的音乐生成器,大伙都很好奇它是怎么训练、拿什么训练的。
对此,官方没有任何透露,不过倒是表示产品有版权保护措施,模型配有自动过滤器,确保在平台上创作的音乐都是原创的。
DeepMind 前工程师打造
据介绍,Udio 主要由一批谷歌 DeepMind 前工程师打造。
具体来看,5 位联创中有 4 位都来自谷歌 DeepMind,分别是:
David Ding
在 DeepMind 工作了 5 年多,走之前是一个 30 人团队(搞生成式 AI 的)的技术主管,现在是 Udio 的 CEO。
![](https://q7.itc.cn/q_70/images03/20240413/471d5a075e7b4504b5bb8696a1f36cd3.png)
Yaroslav Ganin
来自俄罗斯,在 DeepMind 实习 + 全职工作了 6 年多,现在是 Udio 的研究科学家。
![](https://q9.itc.cn/q_70/images03/20240413/72c4ea41e3ec415b91f72fb51c407817.png)
Charlie Nash
来自英国,在 DeepMind 实习 + 全职工作了 5 年多。
![](https://q3.itc.cn/q_70/images03/20240413/631002a4f33746d69ecb648bceabcdf6.png)
Conor Durkan
同样来自英国,在 DeepMind 担任了 2 两多研究科学家。
![](https://q4.itc.cn/q_70/images03/20240413/8ea80b33bedc438fbd7838311765f7b1.png)
唯一一个非 DeepMind 前员工的是 Andrew Sanchez,他是 Udio 的 COO,毕业于牛津大学。
![](https://q1.itc.cn/q_70/images03/20240413/91c990d67c22484ca4fb5eff9d5d84fe.png)
值得一提的是,谷歌 DeepMind 去年 11 月刚刚出过一个音乐生成模型 Lyria。而我们对比 Lyria 的贡献者名单,可以发现 Udio4 位联创的名字都赫然在列:
再加上 Udio 恰好也是去年 11 月成立,于是有网友“斗胆猜测”:Udio 就是从谷歌“出逃的 Lyria”,是他们只花了 3 个月时间在自己的机器上重新训练出来的。
对此,有网友表示,如果真的是这样,谷歌是不是应该提起诉讼呢?
不过,我们很快看到有人在评论表示 Udio 和 Lyria 底层并不一样。
具体如何我们暂未可知。可以确定的是,有着谷歌 DeepMind“血缘”的 Udio 确实掀起了一场 AI 音乐生成的狂欢。
推特上,甚至由 Grok 发起了一场“AI 音乐究竟是创意革命还是行业威胁?”的话题讨论。感觉和当初 AI 绘画火起来如出一辙。
![](https://q9.itc.cn/q_70/images03/20240413/07ad1f72b621410eae4b31350a0dfd99.png)
这样的 Udio 也自是被不少大佬寄予了厚望。
据了解,Udio 目前完成的种子轮融资中,投资人包括 ins 的联创兼 CTOMike Krieger、谷歌 Gemini 负责人Oriol Vinyals,以及真的艺术家 —— 美国说唱歌手 will.i.am(推特粉丝 1154 万)等等。
你觉得 Udio 效果怎么样,与 Suno 相比更喜欢哪个?