“作曲AI”に対して思うこと【音楽×人工知能】

プログラミング

みなさんこんにちは!クフルダモノーツYoshito Kimura(k1mu)です!

  

今回は、巷でしばしば話題に上がるAI“を使った作曲について僕の感想を語っていきたいと思います。

※あくまで僕の私見です。
ご指摘・ご意見・ご感想があればコンタクトフォームよりお知らせください。

はじめに

“AI”について

まず、AI(artificial intelligence)=人工知能は、はっきりとした定義が定まっていない言葉です。

「人工的に作られた知能を持つ物体あるいはそれを作ろうとすることによって知能時代を研究する分野である。」

中島秀之

「知能を持つメカないしは心を持つメカである」

西田豊明

「知能の定義が明確ではないので人工知能を明確に定義できない」

浅田稔
今さら聞けない「AI・人工知能」とは? | AI専門ニュースメディア AINOW
人工知能が何を指しているのか、具体的に説明できる人は少ないかもしれません。近い将来、「人工知能が仕事を奪っていく」と脅威論まで唱えられている人工知能。みなさんはこの人工知能についてどのくらい知っていますか?今回は、「そもそも人工知能とは何か」「人工知能の歴史」「人工知能の活用事例」などについて解説します。

(↑上記のリンク先にさらに色々な先生の定義が紹介されています。)

このように、専門家の先生によっても色々な解釈があるようです。

 

現状では”コンピューターに何らかの学習・推論・判断をさせるプログラム“をふわっと全体的に”AI“と呼んでいる印象です。

今回の記事では、「作曲に関係するコンピュータープログラム全般」を”作曲AI“として考えたいと思います。

音楽は数学的

では、”AI“と“音楽”との関わりを考えてみましょう。

作曲をやらない方は、「“音楽”は、人間の”閃き”や”感性”によって作られている」イメージがあるかもしれません。

しかし、実際はそういった方々が思う以上に“音楽”は数学的です。

これは、「作曲者が数学的に意識して作曲しているかどうか」ではなく
そもそも“音楽”自体が、数学的なシステムの上に成り立っている」という意味です。

そして、めちゃくちゃ雑に言えば”AI“は「“計算問題”を解くプログラム」なわけです。

したがって、“AI”“音楽”わりと親和性の高い分野だと思います。

未だ大半の”作曲AI”の実力が微妙に感じる理由を考察

しかし、「まだまだ“作曲AI“の実力は微妙」という意見が大半だと思います。

この理由は大きく3つあると思います。

①人間側の問題

1つ目は、人間側の問題です。

巷では、”オリジナリティが溢れていて“や”ジャンルに捉われていない“音楽が良しとされます。

しかし、それはあくまでアーティストのブランディングポジション・トークの側面が強いです。

文字通りの意味での”オリジナリティが溢れていて“や”ジャンルに捉われていない“音は、“音楽”であるとすら感じられない可能性があります。

なぜなら、あくまで“音楽”の定義良し悪しを判断しているのは人間だからです。

 

実際、いきなり“前例から大きく外れた音”を聴かされても
大半の人間はそれを簡単には理解できません。

つまり、逆に考えると“作曲AIへの評価で「人間の音楽に対する認知の輪郭が浮かび上がってくる部分がある」とも言えそうです。

【最高音質】ジョン・ケージ 「4分33秒」 44.1kHz / 24bit
音楽の定義に新たな視点を与えた、ジョン・ケージ 「4分33秒」
ASMR Electric Triggers from Ear to Ear (No Talking) Hum. Whir. BuZzZz…
果たして”ASMR”と”音楽”は違うものか?
これらを区別するものは何か?

②アプローチの仕方が効率的ではない可能性

2つ目は、アプローチの仕方が効率的ではない可能性です。

“AI”を作成しているプログラマーの方は、”高度な音楽理論の知識“や”作曲への体感“を持っておられる方ばかりではない印象です。

それ故に、非効率的なアプローチをしているケースがあるのではないかと感じます。

音源から直接データを学習しようとしている

典型例として挙げられそうなのが「音源から直接データを学習しようとしている」ケースです。

この手法は、なかなか現実的ではないと思います。

 

なぜなら、人間が作曲をする時も音源を参考にして音源をいきなり作り出してるわけではないからです。

具体的には、人間は音楽に対して「メロディ・コード・リズム・音色・音響・楽曲構成…」みたいな抽象化を行って処理をしています。

音源から直接データを学習して曲を生成するアプローチは、人間で言うところの「うろ覚えで口ずさんでいる鼻歌」みたい感じですかね…。

したがって、基本的には人間と同じように「細かい段階やパーツごとに処理のアプローチを区分けした方が現実的ではないかな…」と思います。

 

(ただ、音楽ジャンルによってはそれなりに上手くいっていそうなケースもあります。↓)

RELENTLESS DOPPELGANGER \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/ \m/
AIで生成されたデスメタルをライブ配信し続けている動画
音楽生成AI「Dadabots」、高速デスメタルをノンストップでライブ放送中 - Engadget 日本版
数々の著名ミュージシャンを世に送り出してきたバークリー音楽院に通っていたCJ CarrとZack Zukowskiが、世の中でも最も激しい音楽ジャンルと言えるデスメタルの音楽パターンを延々覚え込ませたAIによるYouTubeチャンネル、Dadabotsを作りました。

③「作曲」に対するイメージの違い

3つ目は、“作曲”に対するイメージの違いです。

実は、普段よく耳にする“音楽”の完成度は編曲によって大きく左右されます。

適当な鼻歌でも“作曲”になる一方で“編曲”には音楽的な技術力と知識が不可欠です。

  

…つまり、「本来の意味での“作曲”では既に”AI”は結構優秀」とも言えそうなわけです。

Daddy’s Car

こちらは、The Beatles(ビートルズ)の楽曲を学習させたAIに作曲させた曲を参考に、人間が演奏・アレンジした曲Daddy’s Car』です。

Daddy's Car: a song composed with Artificial Intelligence – in the style of the Beatles

いかがでしょうか。

僕は、The Beatlesの雰囲気をよく捉えていると感じます。
そして、本家The Beatlesの楽曲と比べても、「良い」と感じる部分も多くあります。

(あくまでもThe Beatlesのガチファンではない僕の感想です。)

Benoît Carré: Daddy's Car | AI-composed music
ライブ演奏

…この曲は、どのようなAIの出力に対してどの程度人間が手を加えたか細かい部分は分かりません。

こちらの記事によると

ソニーCSLがAI自動作曲を現実に!? Cubaseで使える「FM Pro」がスゴい【藤本健のDigital Audio Laboratory】
さまざまな分野で応用されている人工知能(AI)。今や作曲の分野での利用も視野に入ってきており、複数の企業や研究機関がAI自動作曲を試みている。そうした中、ソニーコンピュータサイエンス研究所(ソニーCSL)が、米テキサス州オースティンで3月に開かれたSXSW(サウス・バイ・サウスウエスト)において披露したAIアシスト作曲...

歌詞は人間が別途作詞。それに人間が編曲し、人間が歌ったボーカルをレコーディングして、この曲を作っていたのだ。
つまりAIが行なったのはメロディー生成とコード進行、それも100%がAIというわけではなかった。

https://av.watch.impress.co.jp/docs/series/dal/1178759.html

とあります。

しかし、少なくとも「AIで“作曲”された部分がある」のは事実でしょうし、人間が“作曲”した場合でも“編曲”でメロディーやコード進行が変更されるケースはあります。

そして、(僕の完全なる主観ですけど)「人間が“作曲”すれば、誰でも必ずこの曲を超える曲が作れる」とは到底思えません。

したがって、既に「このくらいのレベル感の“作曲”はAIで可能」と言えるのではないかと思います。

AIに対する考え方:良き相談相手

将来、革新的な技術が生み出されれば状況は変わるかもしれません。

しかし、僕は少なくとも現在の時点では”全部作ってくれるAI”よりも
“本来の意味での「作曲」をする”など、“人間の補佐AI”の方が需要があると思います。

その理由は主に2つあります。

①最終的に成果物を判断するのは人間

“人間の補佐AI”に需要を感じる1つ目の理由は、最終的に成果物を判断するのは人間だからです。

特に音楽の場合は、5分の曲をちゃんとチェックするなら最低5分以上かかります。
細かい部分を手直ししたい場合もあります。

したがって、「音源をいきなりアウトプットされても、実はそんなに便利じゃない」と感じます。

それよりも、曲作りの各段階をサポートしてくれる方が助かります。

 

ちなみに、既にそういったソフトウェアやサービスは存在しています。
ここでは、いくつか紹介したいと思います。

Riffer
RIFFERの詳細情報ページ
AUDIOMODERN社製 ソフトウェア/ツール 「RIFFER」の製品詳細情報ページです。

ランダムなリフを自動生成してくれる「Riffer」。

ランダムなシーケンス・パターンを作るのはもちろん、打楽器の音源と組み合わせても面白いです。

実際に、KHUFRUDAMO NOTESの『KEGON』のイントロで鳴っている金属音的なリズムパターンは「Riffer」で出力されたパターンを元に作りました。

【Japanese Djent】KHUFRUDAMO NOTES – KEGON
【DTM】作曲時に考えていたことを話します
Ozone 9
Ozone 9 - iZotope Japan
マスタリングの未来が今あなたの手に。あなたに最適なOzone 9

iZotope社の「Ozone 9」は、ミックスマスタリングといった音源の仕上げの工程に使うソフトウェアです。

その中に、音源のバランス調整などをAIによって行ってくれる機能があります。

個人的にはあまり使っていません。
しかし、このAIの処理結果を参考に作業をされている方も多い印象です。

Flow Machines Professional
Flow Machines – AI assisted music production
AI assisted music production

ソニーコンピュータサイエンス研究所が開発したFlow Machines Professionalは、作曲者の作りたいスタイルに合わせたメロディー、コード、ベースを提案してくれるAIらしいです。

先ほど紹介した『Daddy’s Car』もこのシステムの前身にあたるシステムで作曲されたようです。

一般ユーザーには解放されていないシステムです。

…こういったソフトウェアやサービスが気軽に使えるようになれば、将来もっと作曲のやり易さが向上すると感じます。

②気軽にアイディアを棄却・改変できる

“人間の補佐AI”に需要を感じる2つ目の理由は、「気軽にアイディアを棄却・改変できる」点です。

 

近年、コライト(複数人での作曲)を行うケースが増えてきました。
また、バンドのオリジナル曲制作はメンバー全員でアイディアを出していくのが一般的です。

こういった複数人による作曲は「1人では思いつかない良いアイディアを1曲の中に盛り込める」とされます。

 

しかし、提案されるのは“参加者全員にとって良いアイディア”ばかりでは無いのも事実です。

時には誰かの出したアイディアを棄却・改変する必要が出てきます。

そして、音楽は良し悪しを判断する絶対的な基準が無いので“落としどころ”も難しいです。

音楽的な視点ではなく、人間関係のパワーバランスや忖度によってアイディアが採用されたり…

アイディアのやり取り次第では、誰かがストレスを感じたり人間関係が悪化したりする場合もあるでしょう。

 

それに対して、AIにはアイディアに紐づくプライドや感情がありません。
したがって、10回でも100回でも…気軽にアイディアを棄却・改変できます

ある意味、AIと人間の最大の違いかもしれません。

まとめ

今までの“作曲”のイメージとかけ離れているため、現状AIを使った“作曲”には否定的な印象を持たれる方もいるかもしれません。

しかし、僕は「暗算をするか、電卓を使うかの違い」みたいな感じになる(既になりつつある)のではないかと思います。

タイトルとURLをコピーしました