摘要

1) 一句话总结 Google 在 Gemini 应用程序中推出了基于 Lyria 3 模型的自定义音乐生成测试版功能,允许用户通过文本、图像或视频提示快速创作 30 秒的专属音乐片段。

2) 关键要点

  • 核心模型:集成了 Google DeepMind 最新的生成式音乐模型 Lyria 3(目前为 Beta 版)。
  • 生成能力:支持通过文本描述、照片或视频作为提示,在几秒钟内生成 30 秒的音乐片段(带歌词或纯器乐),并配有 Nano Banana 生成的自定义封面艺术。
  • Lyria 3 升级:相比前代,实现了自动生成歌词(无需自带)、提供更多创意控制(风格、人声、节奏)以及生成更复杂逼真的音乐。
  • YouTube 整合:Lyria 3 已接入 YouTube 的 Dream Track 功能(美国已上线,正向全球推广),用于提升 Shorts 短视频的配乐质量。
  • 音频验证:所有生成的曲目均嵌入 SynthID 隐形水印;用户可上传音频文件让 Gemini 验证其是否由 Google AI 生成。
  • 版权机制:模型训练注重版权和合作伙伴协议,旨在进行原创表达而非模仿特定艺术家;内置过滤器会对照现有内容检查输出结果。
  • 可用性:面向 18 岁以上用户开放,支持英语、德语、日语等 8 种语言;桌面端已上线,移动端将在未来几天内推出。
  • 订阅权益:Google AI Plus、Pro 和 Ultra 订阅用户享有更高的音乐生成使用额度。

3) 风险与不足

  • 版权过滤局限性:官方明确表示其防止侵权的方法“可能并非万无一失”,因此依赖用户主动举报可能侵犯权利的内容。
  • 合规风险:用户必须严格遵守服务条款和生成式 AI 禁止使用政策,严禁利用该功能侵犯他人的知识产权和隐私权。

正文

自 Gemini 应用程序推出以来,我们一直致力于构建工具,鼓励人们通过图像和视频进行创意表达。今天,我们迈出了新的一步:自定义音乐生成。

Google DeepMind 最新的生成式音乐模型 Lyria 3 现已在 Gemini 应用程序中推出测试版(Beta)。只需描述一个想法或上传一张照片,例如“一首关于一只袜子找到另一半的滑稽 R&B 慢歌”,Gemini 就能在几秒钟内将其转化为高质量、朗朗上口的 30 秒音乐片段。为了进一步拓展创意,你甚至可以要求 Gemini 从你上传的内容中汲取灵感。

Lyria 3 的三大核心升级

与之前的 Lyria 模型相比,Lyria 3 在音频生成方面实现了三个重要提升:

  • 无需自带歌词:模型会根据你的提示词自动为你生成歌词。
  • 更多创意控制:你可以对所需的风格、人声和节奏等元素拥有更多的控制权。
  • 更复杂的音乐:你可以创作出更逼真、在音乐性上更复杂的曲目。

如何使用 Gemini 创作音乐

你可以通过以下方式体验这项新功能:

  • 文本生成音乐:描述特定的流派、情绪、内部笑话或回忆,创作出符合你氛围的独特曲目(带歌词或纯器乐)。例如:“我感觉很怀旧。为我妈妈创作一首曲子,讲述我们小时候的美好时光以及她做的家常炸芭蕉的回忆。把它做成一首有趣的、具有纯正非洲风情的 Afrobeat 歌曲。”
  • 照片和视频生成音乐:上传照片或视频,Gemini 会利用这些内容创作出一首歌词完全契合当前情绪的曲目。例如:“用这些照片创作一首关于我的狗 Duncan 在树林里徒步旅行的歌。”

Gemini 应用程序会生成 30 秒的曲目,并配有由 Nano Banana 生成的自定义封面艺术。你可以通过下载或点击分享链接轻松与朋友分享。这些曲目的目的不是为了创作出旷世名作,而是为你提供一种有趣、独特的自我表达方式。

赋能 YouTube 创作者

创作者还可以在 YouTube 的 Dream Track 中探索 Lyria 3。该功能已在美国上线,目前正向其他国家的 YouTube 创作者推出。Lyria 3 将提升每一首独特的 Shorts 短视频配乐的质量。无论是创作抒情主歌还是氛围感背景音乐,更好的配乐定制能力都将把创作者的 Shorts 内容提升到一个新水平。

全新的音频验证功能

在 Gemini 应用程序中生成的所有曲目都嵌入了 SynthID,这是我们用于识别 Google AI 生成内容的不可见水印。我们还提供了更多工具来帮助识别 AI 内容,将 Gemini 应用程序中的验证功能从图像和视频扩展到了音频。只需上传文件并询问它是否使用 Google AI 生成,Gemini 就会检查 SynthID 并利用自身的推理能力给出答复。

负责任的生成式 AI 发展承诺

自 2023 年首次推出 Lyria 以来,我们一直致力于与音乐界合作,负责任地开发这项技术。通过这些合作以及 Music AI Sandbox 等实验,我们学到了很多,并且在训练 Lyria 3 时非常注重版权和合作伙伴协议。

使用 Lyria 3 生成音乐旨在进行原创表达,而不是模仿现有艺术家。如果你的提示词中提到了特定的艺术家,Gemini 会将其作为广泛的创意灵感,并创作出一首具有相似风格或情绪的曲目。我们还设置了过滤器,以对照现有内容检查输出结果。我们深知我们的方法可能并非万无一失,因此你可以举报可能侵犯你或他人权利的内容。此外,用户必须遵守我们的服务条款和生成式 AI 禁止使用政策(禁止侵犯他人的知识产权和隐私权)才能使用我们的产品。

可用性与支持

Lyria 3 现已在 Gemini 应用程序中向所有 18 岁以上的用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,并计划扩大质量和更多语言的覆盖范围。该功能今天在桌面端推出,并在未来几天内推广到移动端应用程序。Google AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。

我们希望 Gemini 应用程序中的音乐生成功能能为你增添有趣、个性化的生活配乐。今天就去 gemini.google.com 尝试一下吧。

相关文档

关联主题