お役立ち(情報)

Text to Musicとは?各AIサービスと使い方を紹介!

text to musicという言葉をご存知でしょうか?

text to musicとは、テキストを入力することで音楽を生成できるサービスのことを指します。いわゆる、文章で命令する形の音楽生成AIです。

今回はtext to musicにあたるサービスで主要なものの使い方とは、商用利用について、概要について解説していきます。

最後まで読んでいただければ幸いです。

text to musicとは何なの?

そもそもtext to musicとは何なのでしょうか。

また、どういったサービスがあるのでしょうか。

見ていきましょう。

テキストを入れると音楽が生成できるAI

text to musicとは、冒頭でも説明した通り、テキストを入れることで音楽を生成することのできるAIです。

text to musicなので、「pop music」などと入力すれば、ポップな感じの音楽を数分で生成してくれる、まさにクリエイターにとって脅威となるツールとなります。

AIの音楽生成とはどのようなしくみとなっているのでしょうか。

AIの音楽生成とは、パターンや音楽の理論、さらに今までの音楽に関するデータをAIに学習させて、音楽を生成します。

AIに、構造やメロディー、コード進行、RHYTHMなどを理解させたうえで、我々が入力したプロンプト(命令文)を認識し、音楽を生成します。

text to musicのサービスの開発は現在かなり進められており、今後さらなる進化が期待されています。

text to musicの音楽生成AI①mubert

text to musicのmubertとは、ロシアの同名の会社が開発したサービスです。

スマホ、PC、どちらでも使用でき、アプリもあります。

日本語で使用することはできず、プロンプト(入力するtext)も英語入力となります。

text to musicの音楽生成AI②music lm

text to musicのmusic lmとは、あのGoogleが開発したサービスです。

2023年1月に発表したものの、著作権に関する課題があることから、一般公開はせず。

ただ、その問題をクリアしたということで、2023年5月11日テストで一般公開をしました。

スマホでも、GoogleのAIを体験できるアプリである「AI test kitchen」から利用可能です。

表示は英語表記ですが、その点はGoogle翻訳でなんとかなるかと思います。

また、プロンプト(入力するtext)は日本語入力可能となります。

text to musicの音楽生成AI③music gen

text to musicのmusic genとは、facebookでおなじみのmeta社が開発したtext to musicのサービスです。

使用されるAIは、大規模な言語モデルと同じく、Transformerを利用したモデルです

公開はオープンソースなため、誰にでも利用することが可能です。

スマホ、PC、どちらでも使用でき、アプリはありませんがブラウザから簡単に利用できます。

サイトは一部日本語部分もありますが、プロンプト(入力するtext)は英語で入力する必要があります。

text to musicの音楽生成AI④suno

text to musicのsunoとは、マサチューセッツの同名の会社suno社が開発した音楽生成AIです。

スマホ、PC、どちらでも使用できますが、アプリはなく、ブラウザでの使用となります。

このサービスの一番の特徴として、歌詞を入力すると、それに合った音楽が生成され、さらにはその歌詞で歌まで生成することが可能なのです。

「I'm satan. I hate god.」とか歌詞を入れれば、おそらくおどろおどろしい音楽が出来上がるのでしょう。

さらには、英語だけでなく、日本語のプロンプトや歌詞にも対応しています。

しかし、英語以外だと精度が落ちる傾向があるそうです。

また、メタルやロック、ジャズやテクノなど、様々なジャンルへの対応がされています。

text to musicサービスの料金プラン、無料で使えるかを紹介

テキスト生成AIや画像生成AIは、サービスによって条件はあれど、無料で使用できるものが多いイメージ。

果たしてtext to musicの各サービスは無料で使用することはできるのでしょうか。

また、有料プランはあるのでしょうか。

見ていきましょう。

mubertの料金

text to musicのmubertの料金についてです。

無料プランはありますが、月最大25曲までという制限付きです。

音質も320kbpでそこそこです。

有料プランは3つ存在し、月額14ドルのクリエイタープラン、月額39ドルのProプラン、月額149ドルのビジネスプランと、様々な有料プランがあり、後述する商用利用に関してもプランによって異なってきます。

music lmの料金

text to musicのmusic lmの料金についてです。

music lmはGoogle社によるテスト段階での公開となっています。

よって、料金は完全に無料となっており、有料プランも存在しません。

music genの料金

text to musicのmusic genの料金についてです。

music genは基本無料で使用することが可能です。

有料プランもありません。

sunoの料金

text to musicのsunoの料金についてです。

sunoは無料で使うことができますが、制限があります。

無料プランだと、一日につき50クレジットが貰えるしくみとなっていますが、1つ音楽を生成するのには10クレジットがかかります。

そのため、無料プランでは1日5曲までが限度となっています。

有料プランは2つのプランが有り、月8ドルのProプラン、月24ドルのプレミアプランがあります。

Proプランは2500クレジット、プレミアブランは10000クレジットと、無料プランと比較して生成できる曲数が違います。

また、商用利用に関しても無料プランとは方針が異なります。

text to music各AIサービスの商用利用・著作権について紹介

発展が進む生成AIサービスですが、著作権のリスクが存在しています。

text to musicのサービスを使用して作成された音楽に関しても、著作権の保護を受ける可能性があります。

しかし、AIに関する法的整備が進んでいないため、AIによって生成された音楽の著作権の帰属に関する問題は非常に複雑です。

一般的に、AIをプログラミングした開発者、AI音楽生成を操作したユーザー、あるいはサービスを提供する企業など、複数の関係者が著作権の主張を行うことが考えられます。

現行の著作権法体系では、AIによる創作物の著作権帰属を明確に定めていないため、使い方は注意が必要です。

ここでは、text to musicの各サービスの商用利用・著作権について見ていきたいと思います。

mubertの商用利用・著作権について

text to musicのmubertの商用利用についてです。

先述したように、プランによって方針が異なってきます。

無料プランと、有料プランで一番安いクリエイタープランは、基本的に商用利用は難しいです。

商用利用を行いたいならば、プロプラン以上にすることが必要です。

プロプラン以上ならば、youtubeなどで広告収入を得ることも可能となり、ビジネスプランならばアプリに使用するのも可能となります。

music lmの商用利用・著作権について

text to musicのmusic lmの商用利用についてです。

基本的に、商用利用には注意したほうが良いでしょう。

元々、著作権的な倫理的な問題があるとして公開を先送りにしたため、著作権に関わるような音楽は学習していないとされています。

しかし、それでもAIで生成された音楽に関する著作権は整備されておらず、広告を得るため、販売などといった、営利目的での商用利用は避けたほうが無難でしょう。

music genの商用利用・著作権について

text to musicのmusic genの商用利用についてです。

Music genはmetaによって、オープンソースで提供されています。そのため、作成した楽曲の商用利用が許可されています。

しかし、それでも基本的、商用利用には注意したほうが良いでしょう。

Music genは既存の音楽から学習して新しい楽曲を生成するため、特定の状況下では著作権法に触れる可能性があります。

AIで生成された音楽に関する著作権は整備されておらず、広告を得るため、販売などといった、営利目的での商用利用は避けたほうが無難でしょう。

sunoの商用利用・著作権について

text to musicのsunoの商用利用についてです。

先述したように、プランによって方針が異なってきます。

無料プランの商用利用は一切できないと考えて良いでしょう。

商用利用を行いたいならば、プロプラン以上にすることが必要です。

プロプラン以上ならば商用利用に関して認められているため、商用利用を行いたいならば、プロプランもしくはプレミアブランを選択しましょう。

text to music各AIサービスの使い方を紹介

テキストの生成AI、画像生成AI、この2サービスの強みとは、使い方が簡単なこと。

使い方の詳細を知らなくても、プロンプトさえ入力してしまえば、AIの知識がなくても使うことができます。

text to musicの各サービスの使い方はどうなのでしょうか。

見ていきましょう。

mubertの使い方

https://mubert.com/render/pricing?via=9d4cf5

右の上の「サインアップ」でアカウント作成後、「create account」をクリックしてログイン。

「1.enter prompt」の下に、「type anything in English」という欄があり、そちらにプロンプトを入れます。

そして、「2.set duration」で生成したい音楽の時間を入れて、「generate track」をクリックし、音楽の生成が可能です。

music lmの使い方

AI Test Kitchenのウェブページ、Android向けアプリ、またはiOS向けアプリに移動します。

MusicLMのセクションを選択し、テキストフィールドに音楽のイメージを記述します。たとえば、「砂浜での夏の日に聴きたいレゲエ」や「ハロウィンのパーティーに最適な恐怖の音楽」などと入力します。

「生成」ボタンをクリックすると、MusicLMは入力したテキストに基づいて音楽を作成します。このプロセスには数分かかることがあります。

Googleの音楽生成AI『MusicLM』とは?特徴や利用方法を解説 | メタバース相談室 (xrcloud.jp)

ここまで紹介しておいて何なのですが、上記の使い方を試してみましたが、そもそものmusic lmが見つからず、正しい使い方そのものがわからない状態です。

AI Test Kitchenに行ってもそれらしきものはなく、残念ながらmusic lmを使うことは難しい可能性があります。

なので、Googleが開発したということで紹介しましたが、使用のハードルが非常に高そうなため、他のtext to musicサービスを使用するのが無難かもしれません。

music genの使い方

https://huggingface.co/spaces/facebook/MusicGen

上記のサイトから「describe your music」の欄に英語で生成したい音楽を入力します。

そして「generate」をクリックすれば曲が生成されます。

「jazz, slow, woodbass」などと、単語で入力するのもありですし、「Spooky music that would fit right into a Halloween party」などと、背景などを入力するのもアリです。

ただ、上のサイトはサンプル版のため、15秒しか生成されません。

試しならば上等ですが、本格的に試したいならば、環境構築の必要があります。

https://ai-illust-kouryaku.com/?p=5070

上記のサイトで環境構築の解説を行なっていますが、プログラムの知識が全く無い方は少しハードルが高い可能性があります。

sunoの使い方

https://www.suno.ai/

上記の公式から、右の上にある、「make a song」を選びます。

アカウントに関してはメールアドレスではなく、Google、マイクロソフト、もしくはdiscordのアカウントが必要となります。

それらのアカウントのどれかでログインしたら、画面の下にあるテキストボックスにプロンプトを入力し、「Create」を押します。

プロンプトは日本語入力可能です。

プロンプトに入力する内容は、曲の内容、もしくは歌詞そのものを入力します。

曲の内容であれば、「ユーロビート調のダンスソング」などでしょうか。

歌詞に関しては、好きに入力しても良いですが、思いつかなければ、チャットGPTといったテキスト生成AIに聞いてみて、それをコピペするのもよいかもしれません。

まとめ

text to musicの音楽生成AIサービスを紹介してきました。

今回紹介したサービス以外にも使えるサービスがどんどん出てきています。

今回紹介させていただいたtext to musicサービスでおすすめは、mubertかsunoでしょう。

やはり簡単に使えるというのは強いです。環境構築ができればmusic genも良いかもしれません。

text to musicサービスを使用する際は、商用利用には十分注意し楽しんで下さい。