AIが映像制作にもたらすもの
ここ数週間、MidjourneyやStable Diffusionなど、テキストから画像生成できるAIが続々登場して話題になっています。
多くは、いくつかの英単語を組み合わせて命令すると、その内容に応じた画像がAIによって生成されるというものです。望んだとおり100%というような精度ではありませんが、かなりツボをついたイラストが生まれたり、いかにAIに上手に解釈させることができるかという生成過程自体のゲーム的な楽しさがあり、絵の基本的なクオリティの高さも相まって様々な方面で注目されています。
しかしこれがそのまま業務に使えるかどうかという話になると、機械学習によって生成される絵というものがこれまでの著作権や著作者人格権の常識が通じない領域のものであり、なかなか一筋縄ではいかないようです。
実は既に動画制作の現場においても、少しずつ目立たない形ではありますがAIが生かされています。例えば、映像に映りこんだ人物や電線など「ゴミ」を消す工程、変な色で収録されてしまった映像素材の自動補正、スローモーションを滑らかに見せるための補完など。これまで手作業でやっていた作業が、AIをベースとしたソフトウェアの技術のおかげで大きく軽減されました。顔認識によって自動的に素材を分類する機能など、使いこなせば素晴らしい機能が実現されているのですが…正直、昔からの制作者ほどこういった斬新な機能には疎いもので、付いていることすら知らないという事が多いです。常識が追い付いていないという表現が適切でしょうか。放送など歴史のある業界は「レガシー」がやや大切にされすぎる現場なので、こういった先進機能を積極的に受け入れて使いこなす意識が高まれば、労働時間などの課題にも良い影響がもたらされるような気がします。
ある案件でAIベースの合成音声ソフトウェア・voicepeakを使用しました。制作途中段階の確認のために、ディレクターなどが自分の声で「仮ナレ」を重ねることはよくあるのですが、これを最近は合成音声で行うことが多いのです。特にそれをお客様へ伝えることなく確認いただいたのですが、「ナレーションの声の感じいいね!」とそのままOKをいただき、結果として合成音声がそのまま本番ナレーションとなりました。お客様はこちらが伝えるまで、それが普通に収録したナレーションだと思って聞いていたそうです。
合成音声に抑揚や感情が込められるのかといえばそれはまだまだ難しい領域で、合成音声がプロのナレーターに取って代わるような段階ではないと思います。(将来的にはわかりません)
上記の一件以降、そういった演技性が求められることが無い制作案件においては、積極的に合成音声のご提案をしています。これまでは予算の関係でナレーションを諦められるお客様も少なくなく、社員の方による(言い方は大変失礼ではありますが)素人ナレーションで代替することもありました。こうした妥協で仕上がった作品は、お客さまも、我々作り手も、そして視聴者にとっても、何かがずっと引っかかる感じのすっきりしないものになり、気持ちがいいものではありません。
AIの画像生成も、デザイナーやイラストレーターの仕事を完全に置き換えるものではなく、使い分けがされていくのではないかと思います。独自性が求められない背景など汎用的な要素を、部分的にAIに生成させるということも増えそうです。結果的に人間が手を動かすべき仕事や人間にしかできない仕事に、より予算を振り分けることができ、やはり全体として作品のクオリティはアップするのではないでしょうか。
そうこう考えていると、今度はなんとテキストから動画生成ができるAIが登場間近であるという話が出てきました。
Make any idea real. Just write it.
— Runway (@runwayml) September 9, 2022
Text to video, coming soon to Runway.
Sign up for early access: https://t.co/ekldoIshdw pic.twitter.com/DCwXcmRcuK
これは楽しみであり、少し恐ろしいですね… 気を引き締めて臨みたいと思います。いや、本当にすごい世の中です。