全新表达方式：Gemini 现在可以创作音乐了

摘要

1) 一句话总结 Google 在 Gemini 应用程序中推出了基于 Lyria 3 模型的自定义音乐生成测试版功能，允许用户通过文本、图像或视频提示快速创作 30 秒的专属音乐片段。

2) 关键要点

核心模型：集成了 Google DeepMind 最新的生成式音乐模型 Lyria 3（目前为 Beta 版）。
生成能力：支持通过文本描述、照片或视频作为提示，在几秒钟内生成 30 秒的音乐片段（带歌词或纯器乐），并配有 Nano Banana 生成的自定义封面艺术。
Lyria 3 升级：相比前代，实现了自动生成歌词（无需自带）、提供更多创意控制（风格、人声、节奏）以及生成更复杂逼真的音乐。
YouTube 整合：Lyria 3 已接入 YouTube 的 Dream Track 功能（美国已上线，正向全球推广），用于提升 Shorts 短视频的配乐质量。
音频验证：所有生成的曲目均嵌入 SynthID 隐形水印；用户可上传音频文件让 Gemini 验证其是否由 Google AI 生成。
版权机制：模型训练注重版权和合作伙伴协议，旨在进行原创表达而非模仿特定艺术家；内置过滤器会对照现有内容检查输出结果。
可用性：面向 18 岁以上用户开放，支持英语、德语、日语等 8 种语言；桌面端已上线，移动端将在未来几天内推出。
订阅权益：Google AI Plus、Pro 和 Ultra 订阅用户享有更高的音乐生成使用额度。

3) 风险与不足

版权过滤局限性：官方明确表示其防止侵权的方法“可能并非万无一失”，因此依赖用户主动举报可能侵犯权利的内容。
合规风险：用户必须严格遵守服务条款和生成式 AI 禁止使用政策，严禁利用该功能侵犯他人的知识产权和隐私权。

正文

自 Gemini 应用程序推出以来，我们一直致力于构建工具，鼓励人们通过图像和视频进行创意表达。今天，我们迈出了新的一步：自定义音乐生成。

Google DeepMind 最新的生成式音乐模型 Lyria 3 现已在 Gemini 应用程序中推出测试版（Beta）。只需描述一个想法或上传一张照片，例如“一首关于一只袜子找到另一半的滑稽 R&B 慢歌”，Gemini 就能在几秒钟内将其转化为高质量、朗朗上口的 30 秒音乐片段。为了进一步拓展创意，你甚至可以要求 Gemini 从你上传的内容中汲取灵感。

Lyria 3 的三大核心升级

与之前的 Lyria 模型相比，Lyria 3 在音频生成方面实现了三个重要提升：

无需自带歌词：模型会根据你的提示词自动为你生成歌词。
更多创意控制：你可以对所需的风格、人声和节奏等元素拥有更多的控制权。
更复杂的音乐：你可以创作出更逼真、在音乐性上更复杂的曲目。

如何使用 Gemini 创作音乐

你可以通过以下方式体验这项新功能：

文本生成音乐：描述特定的流派、情绪、内部笑话或回忆，创作出符合你氛围的独特曲目（带歌词或纯器乐）。例如：“我感觉很怀旧。为我妈妈创作一首曲子，讲述我们小时候的美好时光以及她做的家常炸芭蕉的回忆。把它做成一首有趣的、具有纯正非洲风情的 Afrobeat 歌曲。”
照片和视频生成音乐：上传照片或视频，Gemini 会利用这些内容创作出一首歌词完全契合当前情绪的曲目。例如：“用这些照片创作一首关于我的狗 Duncan 在树林里徒步旅行的歌。”

Gemini 应用程序会生成 30 秒的曲目，并配有由 Nano Banana 生成的自定义封面艺术。你可以通过下载或点击分享链接轻松与朋友分享。这些曲目的目的不是为了创作出旷世名作，而是为你提供一种有趣、独特的自我表达方式。

赋能 YouTube 创作者

创作者还可以在 YouTube 的 Dream Track 中探索 Lyria 3。该功能已在美国上线，目前正向其他国家的 YouTube 创作者推出。Lyria 3 将提升每一首独特的 Shorts 短视频配乐的质量。无论是创作抒情主歌还是氛围感背景音乐，更好的配乐定制能力都将把创作者的 Shorts 内容提升到一个新水平。

全新的音频验证功能

在 Gemini 应用程序中生成的所有曲目都嵌入了 SynthID，这是我们用于识别 Google AI 生成内容的不可见水印。我们还提供了更多工具来帮助识别 AI 内容，将 Gemini 应用程序中的验证功能从图像和视频扩展到了音频。只需上传文件并询问它是否使用 Google AI 生成，Gemini 就会检查 SynthID 并利用自身的推理能力给出答复。

负责任的生成式 AI 发展承诺

自 2023 年首次推出 Lyria 以来，我们一直致力于与音乐界合作，负责任地开发这项技术。通过这些合作以及 Music AI Sandbox 等实验，我们学到了很多，并且在训练 Lyria 3 时非常注重版权和合作伙伴协议。

使用 Lyria 3 生成音乐旨在进行原创表达，而不是模仿现有艺术家。如果你的提示词中提到了特定的艺术家，Gemini 会将其作为广泛的创意灵感，并创作出一首具有相似风格或情绪的曲目。我们还设置了过滤器，以对照现有内容检查输出结果。我们深知我们的方法可能并非万无一失，因此你可以举报可能侵犯你或他人权利的内容。此外，用户必须遵守我们的服务条款和生成式 AI 禁止使用政策（禁止侵犯他人的知识产权和隐私权）才能使用我们的产品。

可用性与支持

Lyria 3 现已在 Gemini 应用程序中向所有 18 岁以上的用户开放，支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语，并计划扩大质量和更多语言的覆盖范围。该功能今天在桌面端推出，并在未来几天内推广到移动端应用程序。Google AI Plus、Pro 和 Ultra 订阅用户将享有更高的使用额度。

我们希望 Gemini 应用程序中的音乐生成功能能为你增添有趣、个性化的生活配乐。今天就去 gemini.google.com 尝试一下吧。

wsl-docs

探索