Google は、Lyria 3 Pro が Gemini (およびその先) に登場し、音楽生成を新たなレベルに引き上げます

ちょうど 1 か月前、人工知能による音楽生成の最初のバージョンである Lyria 3 を発表した後、Google は再びこの話題に戻り、Lyria 3 Pro を発表することでさらにレベルを上げました。Lyria 3 Pro は、より優れた創造的な制御、長時間の出力、そして何よりも楽曲のより洗練された理解を提供するように設計されたモデルのより高度な進化です。

Google や Google DeepMind が開発したテクノロジーでよくあることですが、この目新しさは単一の製品に限定されるものではなく、より広範なエコシステムの一部です。実際、Lyria 3 Pro は、Gemini アプリ、開発者用ツール、さらにはビデオ作成専用のソリューションを含む複数のプラットフォームで配布されています。

Lyria 3 Pro でより長く、より制御可能で、よりスマートな音楽を

Lyria 3 Pro の最も重要な側面の 1 つは、生成されるコンテンツの長さに関するものです。実際、以前のバージョンでは約 30 秒の短いクリップでしたが、最大 3 分の曲を完成させることができます。最大 6 倍の長さの出力について話していることを考えると、その違いはわずかなものではありません。

しかし、それは単に長さの問題ではなく、Google は音楽構造の理解に多大な努力を払っており、ユーザーがイントロ、ヴァース、コーラス、ブリッジ、複雑なトランジションを正確に指定できるようになりました。

言い換えれば、それはもはや単に曲全体を説明するという問題ではなく、少なくとも紙の上では従来のワークフローにますます近づいた制御レベルで、個々のコンポーネントにタイムリーに介入することの問題です。

したがって、Lyria 3 Pro が実験だけでなく、サウンドトラック、ポッドキャストのバッキングトラック、vlog の音楽やビデオチュートリアルなどの具体的なコンテンツの制作にも適したツールとして紹介されているのは偶然ではありません。

当初の予想どおり、Google はモデルの改良に限定せず、その利用可能性を、それぞれ非常に特殊な用途を持つより多くの製品やサービスに拡張することを決定しました。

Vertex AI -> オーディオ制作のスケールアップを目的として、企業向けにパブリックプレビューで利用可能 (ビデオゲームやクリエイティブプラットフォームなど)
Google AI Studio と Gemini API -> アプリに音楽生成を統合したい開発者向けに設計
Google Vids -> AI によって生成されたビデオにカスタムサウンドトラックを追加できます (Workspace、AI Pro、Ultra ユーザー向けに展開中)
Gemini アプリ -> おそらくエンドユーザーにとって最も即時的なアクセスポイントであり、有料サブスクリプションには高度な音楽生成が含まれています
ProducerAI -> アーティストとプロデューサー向けに設計されたコラボレーションプラットフォーム

最も興味深い新機能の 1 つは、まさに Gemini に焦点を当てたものです。サブスクリプションユーザーはすでに Lyria 3 Pro を使用して完全なトラックを作成できますが、1 日あたりの制限はプランによって異なります (1 日あたり 10、20、または 50 曲)。

Google は、Lyria 3 Pro の開発が実際のアーティストやプロデューサーを巻き込み、音楽業界と協力してどのように行われたかを強調しています。同時に、同社は知的財産の面で明確な境界線を設定しようとしている。つまり、モデルは特定のアーティストを模倣しておらず（たとえプロンプトで言及されていたとしても）、コンテンツはGoogleが使用権を持っている素材を使用して生成され、さらに各出力には、AIで作成されたコンテンツを識別する目に見えない透かしであるSynthIDがマークされている。

このようなケースではよくあることですが、このバランスはまだ発展途上であり、おそらく今後数か月間議論され続けるでしょう。

Lyria 3 Pro により、Google は日々の創造的なプロセスにますます統合される人工知能のアイデアに向けてさらに一歩を踏み出しました。もはや画像やテキストだけでなく、構造化され、モジュール化可能で、（少なくとも部分的には）正確に制御可能な音楽も含まれています。

当然のことながら、これらのツールが実際にプロのワークフローにどの程度導入できるのか、またどの程度までアマチュアまたは実験的な使用に限定されるのかはまだわかりません。