FC2ブログ

YouTubeにおけるラウドネスノーマライゼーションについての備忘録

新型コロナウイルスの影響で現場が中止になったりして時間が出来たので、YouTubeにおけるラウドネスノーマライゼーションの挙動をチェックしてみました。自分の中だけで知識として蓄積してもよかったのですが、せっかくなので備忘録を兼ねてブログに書いてみようと思います。

さて、現状YouTubeは誰でも動画をアップロードできます。全くデジタル音声の知識のない素人から、プロの音楽制作者まで、PCはもちろん、スマホでも気軽に動画を公開できます。当然、個々の技術の有無によって、動画ごとに大きな音量差が生まれることになります。そうなると、動画ページを開くたびに爆音になったり、音が小さすぎて聞こえない、ということが生じ、ユーザー側でその都度ボリューム調整をするのは非常に面倒です。

YouTubeにおけるラウドネスノーマライゼーションは、そういった音量差を均一化し、ユーザー側に負担となる動画ごとのボリューム調整をしなくてもいいようにつけられた機能です。実際の動きとしては、基準を超える音量の動画の音声を、超えた分だけ下げる、という挙動をする模様です。基準より小さい音量の動画の音声はそのままですので、例えば、とても小さな自然音だけがずっと流れている動画などはそのまま静かな世界を届けられるというわけです。

さて、今回はYouTube側で自動的に調整が入る中で、どのように音声を調整してアップロードするのが最適なのか、ということを考えたいと思います。

まず、ラウドネスとは何なのか?ということですが、これは等ラウドネス曲線などで表されるように、人の耳は敏感な周波数と鈍感な周波数があります。電気的には同じレベルの信号であっても、空気振動となって人の耳に届けば、敏感な周波数では大きく聞こえ、鈍感な周波数では小さく聞こえる。それを考慮に入れて、実際に人が感じるであろう音量感を数値化したもの、と捉えていただいて構いません。勿論聞こえ方に個人差はありますが。

これはLUFS(もしくはLKFS)という単位で表され、Loudness Units relative to Full Scale(もしくはLoudness, K-weighted, relative to full scale)の省略形で、どちらも同じものと考えていただいてOKです。

今の地上デジタル放送も同じ規格に基づいて音量調整がされており、-24LUFS(±1LUFS)を基準に番組、CMが作られています。とはいえ、音の表現として音の大小は不可欠なものなので、短い時間ではなく、コンテンツ全体で計算して、この基準に合わせるように音量調整がなされます。基準から逸脱する制作物は、NGを食らい、やり直しとなったりします。
生放送でも同様で、リアルタイムにこの基準内に収まるように、ミキサーが調整しています。ちなみに私も生放送のバラエティ番組のミキサーをやっています。レコーディングだけが音の仕事ではないのです。
なお、TVで±1LUFSが許されているのは、この生放送に対応するためです。番組終盤で突然盛り上がったりすると、必ずしも-24LUFSぴったりをキープ出来るわけがありませんので、そのマージンとして設けられています。

さて、テレビの話は置いておいて、YouTubeに戻りましょう。

まず、YouTubeにおいて、どういった特性でラウドネスを検知しているのかを知る必要があります。ラウドネスは規格ですので、勝手に計測方法を変えていいものではないはずですが、独自のプログラムを運用している可能性はあります。

というわけで、まずは複数の周波数の正弦波で-5LUFSのファイルを作り、YouTubeに上げて、ラウドネスノーマライゼーション(長いので、以下LNと記載します)の挙動を見てみました。

◇50Hz:100%/35% (content loudness 9.1dB)
◇100Hz:100%/35% (content loudness 9.1dB)
◇250Hz:100%/35% (content loudness 9.1dB)
◇500Hz:100%/35% (content loudness 9.1dB)
◇1kHz:100%/35% (content loudness 9.1dB)
◇2kHz:100%/35% (content loudness 9.1dB)
◇4kHz:100%/35% (content loudness 9.1dB)
◇8kHz:100%/35% (content loudness 9.1dB)
◇16kHz:100%/35% (content loudness 9.1dB)
◇20kHz:100%/41% (content loudness 7.8dB)

ここでLNによるラウドネスの変化は20kHz以外は同じ値であることが分かります。つまり超高域に入るまでは、一般的なラウドネス計算と同じ周波数特性をもっていると考えられます。

ですので、20kHz付近で同じ正弦波を作り、挙動をチェックしたところ、
◇19kHz:100%/36% (content loudness 8.8dB)
◇20kHz:100%/41% (content loudness 7.8dB)
◇21kHz:100%/57% (content loudness 4.9dB)
となり、19kHz付近から落ちはじめ、21kHzでさらにグッと下がっています。

これは超高域に行くと、LNの影響が少なくなることを示しています。つまりデジタルメーター上の振りも大きくなるはずですが、実際には21kHzになると、メーターはほぼ触れず、音も出力されませんでした。ブラウザ上の問題なのか、YouTube側の再生エンジンの仕様なのか不明ですが、とりあえず実際には音として出てきません。Google ChromeとFirefoxで検証したところ値は一緒なので、ブラウザというよりは、YouTube側の問題のような気もしますが。

各周波数ごとのYouTubeアップ前とアップ後のデジタルピーク値は以下の通りです。
◇50Hz:-0.3dBFS → -9.3dBFS
◇100Hz:-3.1dBFS → -12.2dBFS
◇250Hz:-4.1dBFS → -13.1dBFS
◇500Hz:-4.2dBFS → -13.3dBFS
◇1kHz:-4.7dBFS → -14dBFS
◇2kHz:-7.1dBFS → -16.3dBFS
◇4kHz:-7.3dBFS → -17.2dBFS
◇8kHz:-8.2dBFS → -18.5dBFS
◇16kHz:-9.1dBFS → -16.8dBFS
◇20kHz:-7.5dBFS → -20dBFS

ラウドネス値は単位はLUFSですが、増減の数値はdBFSと変わりません。つまり、1LUFS下げたければ、そのまま1dB下げればよいはずなのです。しかし、この結果は2kHz以下は概ね0.1dB程度の誤差の範囲と思われる差ですが、4kHzと8kHzはLNによって下げられたと表示される9.1dBよりも1dBほど出力が下がっていることを意味しています。そして逆に16kHzでは9.1dBよりも1dBほど出力が上がっています。これは周波数によってEQでもされているのか?と思わされる何とも不思議な結果でした。

しかし、ピンクノイズも同じようにYouTubeにアップしてみたところ、この画像のような結果になりました。

YouTube比較スペアナ

白がアップ前の元ファイル、赤がYouTubeです。
4kHzも8kHzも16kHzも特性的にはほぼ一緒。YouTubeの方は17kHzあたりでスパッと上は切れていました。強烈なLPFでカットしているのでしょう。
また、正弦波のみでチェックした時は、19kHzも20kHzもスピーカーから音が出ています。

正弦波と全周波数帯域に渡る信号では挙動が異なる模様です。しかし、正弦波のみで動画を上げるということは普通はしませんし、20kHzなんて超高次倍音領域です。YouTube用だからといって、気にする必要はないように思います。バランスよくミックス、調整すればよいでしょう。

問題はそれよりもLNの影響の方です。

ピンクノイズを使い、5分間の中でランダムに音量が上下するようにしたところ、このような結果になりました。
◇-9LUFS 100%/58% (content loudness 4.7dB)
◇-12LUFS 100%/82% (content loudness 1.7dB)
◇-15LUFS 100%/100% (content loudness -1.3dB)

全て-13.7LUFSになるように、LNがかかっていますね。

次に、知らない方もいると思いますが、ブラウンノイズというものを使って、音色やダイナミクスを調整した場合にどうなるか調べました。同じようにランダムに音量が上下するようにしています。
◇-19LUFS 100%/100% (content loudness -5dB)
◇-19LUFS EQで中域と高域をブースト 100%/100% (content loudness -5dB)
◇-15LUFS コンプで圧縮して音圧UP 100%/100% (content loudness -0.9dB)

ブラウンノイズはピンクノイズと比べると、低域にエネルギーが寄っていますので、元々ラウドネス値が上がりづらいです。19LUFSと低い値になった2つのファイルは、EQをかけても同じ値を示しました。基準まではあと5dB足らないよ、と言われています。ただ、これ以上上げるとデジタルクリップを起こすので却下しました。そこでコンプで無理やりレベルを上げてみると、あと0.9dB足らないよ、と言われました。

どうやら-14〜14.1LUFSが基準のようですね。
先ほどのピンクノイズとは異なる結果になりました。

では、音楽ファイルではどうなるのか。
先日レコーディングからミックス、マスタリングまで全て担当した楽曲で試してみます。マスタリングでかなり音圧を出しましたので、マスタリング後と、配信も考慮に入れたレベルでミックスした音源と比較してみます。

◇Tr1マスタリング前-14LUFS 100%/100% (content loudness 0.0dB)
◇Tr1マスタリング後-5.9LUFS 100%/39% (content loudness 8.1dB)
◇Tr2マスタリング前-15LUFS 100%/100% (content loudness -0.9dB)
◇Tr2マスタリング後-8.3LUFS 100%/52% (content loudness 5.7dB)

どれも-14LUFS前後を基準としてLNが行われた模様です。

そして、先ほど示したように、各周波数の正弦波を試した時も、-14.1LUFSになるようにLNがかかっていました。

これらの事例で分かることは、正弦波で一部実際のピークレベルに違いが出たことは気になりますが、おそらくYouTubeのラウドネスノーマライゼーションは-14LUFSを基準にして、アップロードされたファイルの音量を調整しているということです。この値を基準にしてミックス、編集し、動画をアップロードすれば、ダイナミクスを生かした音を聴かせることが出来るということのようです。

ちなみにラウドネス値の算出は-70LUFSを絶対閾値として、それ以下の音量の時を無視します。つまりコンテンツの大半が無音で、一瞬だけ爆音の音源などは、ラウドネス値に反映されるのが爆音の部分だけとなるため、意外とラウドネス値が高くなり、LNで-14LUFS程度になるように下げられます。これも実験済みです。

また、-70LUFSまでいかなくても、大きいところは-5LUFS、小さいところは-40LUFSなんかの音源も小さいところを無視されて計算されるので、それほどラウドネス値は下がりません。無理やり大きい音を聴かせることは出来ないということですね。

過剰な爆音は耳にも悪いですし、音の大小が大きすぎるコンテンツは何より聞きづらいです。CMになった途端に音が大きくなると鬱陶しいですよね?それと同じことが言えます。視聴時の音量は配信側ではなくユーザー側が決めるものです。無理に大きい音にするのではなく、聴きやすい音量で楽しいコンテンツを制作していきましょう。
スポンサーサイト



初音ミク登場から10年

今やすっかり音楽ジャンルの一つとして定着したボーカロイド。
その代表格と言っていいのが「初音ミク」で、
あと2ヶ月ほどで10周年を迎えるこのソフトと私の出会いは、
10年前、私が所属していた大阪のCM制作会社でのことでした。

この会社はCMの音に特化した会社で、数々のラジオCMで賞を獲っていたり、
皆さんが見たことのあるであろうCMの音楽制作などを行っていました。
おかげさまで私の名前もいくつかの作品でクレジットしていただいています。

そのCM制作という業務で著作権フリーの音源を大量に保有しており、
その音源をいくつかをクリプトンフューチャーメディアから購入していたため、
定期的にDMが届き、その中で発売前の初音ミクの存在を知ったように記憶しています。

社内の反応は少しばかり冷ややかなものでした。
プロデューサー陣も含め、パッケージイラストに加えて、
・年齢:16歳
・身長:158cm
・体重:42kg
といったキャラクター設定が付けられていたことから、
いかにもオタク向けな萌え系商品だろうとの印象をもったわけです。

とはいえ、CMの音楽制作において、本チャン以外に"仮歌"を録る機会が結構あったことから、
通常は知り合いのシンガーに依頼して、スタジオに来てもらい収録していた作業を、
ソフトウェアに置き換えることで、コスト削減を図れるのでは?と期待もしました。
この仮歌というのは企画が正式採用される前のプレゼン用だったりするので、
ぶっちゃけ予算がなく、お金をかけずに済めばいいよね、、、と思うのは当然のことです。

まあ、そんな感じでデモ音源を聴いてみた時の感想を包み隠さず述べると、、、

「何この機械音声・・・甲高いだけで表情のかけらもなく、全く話にならない。
 業務では到底使えないな。」
というものでした。

当然といえば、当然です。
いまだに、リアルに人が歌っているように調整するのは至難の技ですし、
それだけボーカリストの声というのは、唯一無二の価値を持つものなのです。

そんな感じであっさりと私がいた会社ではスルーされた初音ミクですが、
ニコニコ動画で火が付き、DTMをやって遊ぶ人たちの間では大人気に。
一般層にも市民権を得ていき、2011年にはCMでも初音ミクの声が使われるものが現れました。
この時は単純に人の歌の代替品としてだけ捉えていた、視野の狭さを思い知らされましたね。

私自身が関わった仕事という意味では、
2009年に会社を離れてフリーになった直後に担当させてもらった、40mPさんのアルバムや、
他の制作でもよく初音ミクの声を耳にするようになりました。

発売から間もなく10年。
すっかり一つの音楽文化として定着したボーカロイドに火をつけた初音ミクですが、
これから先、どのような進化を見せていくのか。
もっと人に近づくのか、機械的なニュアンスこそがこの製品の魅力として、
現状の音を維持していくのか、あらためて注目したいと思います。

JZ MICROPHONES BH-1

先日あまり大阪のスタジオには置いていないマイクを試す機会がありましたので、
備忘録として印象を書き記しておこうと思います。

そのマイクとはラトビアのマイクメーカーJZ MICROPHONESのBH-1。
スペック詳細はこちらのページをご覧ください。
http://www.onzu.co.jp/product_jz_01.html

今回はボーカルで使用したのですが、第一印象は「目立つ音」だということ。
非常にフォーカスが鋭く、声のざらつき感、エッジが強調された音になります。
オケに混ぜた時に、U87Aiが中域でくっきりとした存在感を出すのに対して、
このマイクはもっと上の帯域で目立ってくる印象があります。
声に使った場合は耳に刺さると感じる方もいるかもしれません。
私自身も声や歌いかたによって合う合わないが激しそうなマイクだと思います。
個人で買おうとされる方には、購入前にデモ機でテストすることをお勧めします。
結構お高いマイクですので(笑)

ウィスパー系の歌やアコギを煌びやかに録りたい時には良さげな特性だと思うので、
また、そういった音に使う機会があれば、追記したいと思います。

NEUMANN値上げ

値上げの話題です。
と言っても、うちのレコーディング料金の話ではなく、マイクのお値段のお話。

レコーディングスタジオ定番のメーカーとして知られたNEUMANNですが、
ここのマイクが5月から値上がりする模様です。

http://www.miroc.co.jp/now_on_sale/160421-neumann/

業界標準として知られるU87Aiに至っては、10万円以上の値上がり。。。
ショックマウントとセットで44万円になります。
何を根拠にそれだけ値段が上がるのか、甚だ疑問ですが、
元々U87Aiは日本で買う方が海外で買うより安いくらいのマイクだったので、
もしかしたら、今回の値上げ後の価格が本来あるべき価格だったのかもしれません。

ニコニコ動画で「歌ってみた」なんかをやっている歌い手さん達には、
プロ御用達のイメージがあって、ある意味憧れのマイクだったと思うのですが、
これでおいそれとは買えない値段になってしまったのではないでしょうか?
この値段で買うなら、もっとU87Aiは勿論のこと、
もっと色んなバリエーションを備えたレコスタで録音する方が、
結果的に安く好結果を出せると思います。

ProTools HDXやOLD NEVE、豊富な高級マイクなど、
到底個人で揃えられるものではありませんが、
レコスタに行けば、それらをいくらでも使えるわけです。
(NEVEや高級マイクは置いてないスタジオも多いですが)

ちなみにそこまで高級なマイクというわけではありませんが、
うちもProTools HDX、OLD NEVE、豊富なマイク(勿論U87Aiも)は、一通り全部揃えています。
それでいて、値段を聞いたらびっくりするくらいお安くボーカルレコーディング出来ます。

是非、大阪でレコーディングをお考えの際は、ご相談下さいませ。
ご連絡は下記URLのメールフォームからお願い致します。
http://accel-studio.com

震災再び

東日本大震災から5年。
東北ではまだまだその爪痕が消えきらず、
福島原発では今も日夜戦い続けている人がいる中、
今度は九州で大きな地震が発生しました。

14日に震度7の地震が来たものだから、これでもうここまでの地震は来ない、
と思われた方が16日未明のさらに規模の大きな本震で亡くなられた模様で、
本当に残念でなりません。

自然の力はいつも私たちの想像を大きく超えてきて、無情に残酷に命を奪っていきます。
ああしておけば、こうしておけば、被災地からはそんな無念の声が聞こえてくる中、
やはり5年前と同様、私には何もすることが出来ません。
私のような素人がボランティアと称して、現地に赴いたところで、
邪魔にしかなりませんし、ただただ普段と同じように生活をして、
仕事で挙げた利益の中から募金をするくらいです。

こういう時だからこそ、いつも通りに。
こういう時だからこそ、明るく顔を上げて。
そして自分がこうして平穏に生きている喜びをかみしめて、
一つ一つの仕事をしっかりとこなしていこうと思います。
プロフィール

アクセルスタジオ ikenaga

Author:アクセルスタジオ ikenaga
レコーディング・マスタリングエンジニア ikenaga です。
関西を中心に、レコーディング/ミキシング/マスタリング/MA/音声編集・ノイズ除去などの録音業務と、
ジングル・サウンドロゴ・効果音制作などの制作業務を行なっています。

ご依頼・お問い合わせ・お見積もりのご依頼は、
↓のホームページからよろしくお願い致します。

https://accel-studio.com/

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR