専用オーディオルームに住んでいると思ったら、ヘッドホンに住むオーディオ有識者になっていました。4月1日、日本では新年度が始まり新しい生活新しい環境に移り変わる節目の日です。そんな日に開催されるエイプリルフール。10年以上前はネットの一大コンテンツとして盛り上がっていましたが、最近では目が肥えたのか、沢山の批判にさらされることを恐れてか、すっかり陳腐化しました。昔は4月1日に合わせてブログやHTMLサイトで気合いを入れて改装したものです。
現在私は、マジシャンでポーカープレイヤーですので、毎日がエイプリルフールみたいなものなので4月1日のありがたみがみたいなものはあまり感じなくなりました。

さてそんな4月1日ですが、Twitterにて一つ実験的な空気録音をあげてみました。以前、「スピーカーの音を煮詰めていくと、ハイエンドヘッドホンの音に近づいてかもしれない」「もしかしたらスピーカーの音はハイエンドヘッドホンの音に近いのかもしれない」という趣旨の発言をしました。オーディオガチ勢から、それは絶対にあり得ない、ないない、スピーカーからヘッドホンの音がするわけがないと言われました。これはつまり、普通の人は、ヘッドホンの音とスピーカーの音を間違えるなんてことはまずあり得ないと言えます。しかしながら、頭に装着して聴くヘッドホンと座って聴くスピーカーでは本当に間違えようがない以前に比べられません。そこで、空気録音の登場です。

2023年4月1日11時に以下のような空気録音動画をTwitterへあげました。

この動画に対して、アンケートをとりました。

動画を貼り付けたツイートの24時間でのリザルト
表示回数 5101回
動画視聴回数 1462回 (ユニーク再生数 1118回)
いいね 56件
リツート 7件
引用RT 2件(1件は自分)
リプライ 8件

その動画にぶら下げたアンケートのツイートのリザルト
表示回数 626回
投票数 102票

ちょうど100票ほどアンケートに答えてもらえました。
空気録音を聴いてヘッドホンぽいと感じた人は少し感じる気がするも含めると41%
対して、普通にスピーカーの音だと感じた人は33%でわからないと合計すると59%で6割の人はこの空気録音ではヘッドホンぽさを感じることができなかったといえます。
アンケートの結果では、普通にスピーカーの音だと感じた人が最も多くなりました。

こちらの動画の全容はこうです。
こちらの動画は、3月30日の夜に、HD800の音をROLANDのバイノーラルマイク「CS-10EM」にて録ったものを、スピーカーの空気録音をしている映像に重ねただけのものです。事前のテストにて、バイノーラルマイクでスピーカーの音とヘッドホンの音を録って聞き比べ見ましたが、録音結果は、比べる余地もないくらい全くの別物でした。HD800で録った音はあまりにもヘッドホンの音なので、音を重ねたりリバーブやエコーを入れたりして、うまく誤魔化そうと思いましたが残念ながら、いじればいじるほどに、変な音になっていくため、最終的な音の処理はHD800で録った音を音量調整したのみです。
このままではかなり多く人からその録音ヘッドホンじゃんと言われてしまうかなと思い、音以外でのアプローチを行い、すこしばかり誤魔化すことにしました。部屋を暗くして部屋とオーディオの全貌をわからなくしつつ、MV1をスピーカーにかなり近づけて置いて撮影しました。加えて、面倒にならないことも含めて、フリー音源を使いました。優秀録音や有名な曲では誰でもすぐに違和感に気づくと思いました。
それでも、ヘッドホンで録ったバイノーラル録音は、左右で音がセパレートされていますし、ぱっと聴いてもあまりにも残響音やノイズが少なすぎてあきらかな違和感があります。企画倒れ気味だなと思いつつも、4月1日の勢いで、スピーカーの映像とバイノーラル音声を編集して重ねただけのものをアップロードしました。

100票入ったアンケートの結果ですが、思っている以上に意見が割れました

まず、1.のヘッドホンの音がすると答えた人は、非常にマージナルな1ツイートの中で、空気録音がかなりの精度で聴けてますし先入観なく判断ができている気がします。ここでヘッドホンとこらえられた人は、結構凄いと思います。中には普通に、これヘッドホンなんじゃないかなと思った人もいるかもしれません。

2.の少しヘッドホンの音がする気がすると答えた人。あくまで空気録音なので断言はできないですが、とりあえずヘッドホンぽいと感じアンケートにも断言はできないけどそれっぽいと感じることができていると思います。聞き慣れない曲での空気録音なのでかなりヘッドホンとは言い切れない感じは十分に理解できます。また4つの選択肢では最も少数派す。

3.の普通にスピーカーの音と答えた人は、最も多く、33%の票が入りました。スピーカーからヘッドホンぽい音など絶対しないなど強い先入観の元判断しているかもしれません。映像を見てそのまま答えたかもしれません。まず完全に左右でセパレートされているヘッドホンの音なので、流れてきたツイートをなんとなく見て聴いている可能性が高い気がします。
しかしながら、AntelopeでHD800でもスピーカーぽいと感じられるのならやっぱりHD800にはスピーカーの要素は強いのかもしれません。このような明らかにヘッドホンの音の空気録音でも、ぱっと見スピーカーで録った風の見た目ではバイアスがかかってしまい、3割くらいの人は音の正体がわからなくなるようです。逆に真剣にヘッドホンがなっているけど、普通のスピーカーぽさを感じた人はなにか特別な感覚の持ち主かもしれません。

4.のわからないを選んだ人は、ある意味最も冷静な人だと思います。4月1日であるし、なんだか違和感のあるツイート、こういった怪しく曖昧な環境下では、確定的な判断を下すよりも、有象無象の一つのツイートに対して、わからないとスルーするのが良い気がします。情報反乱の時代、一つ一つの情報を精査していたら脳がパンクします。なんだか変な違和感があるという感覚は非常に重要だと思います。今のネット社会で断定的な決断をだすよりもわからないで保留しておいた方がいいことが多い気がします。

これまでも、空気録音については、本当に伝わるのか、伝わらないのか疑問に思い、実験的な動画をいくつかあげてきました。今回の結果では、ヘッドホンの音にヘッドホンぽさを感じるか感じないかの、ほぼ2択の質問でも大体50:50になってしまいました。これは、オーディオの音は非常に曖昧なので、どんな空気録音でも実際の試聴だとしても、何をどうしたのかはっきりとわかるように明記し試聴するポイントのピントを合わせないと意味のないものになると言えそうです。明らかにヘッドホンの音だとしても人のバイアスや認知力には限界があります。
なにより。空気録音は、何も知らない人が聞いたら本当にただの劣化した音楽でしかありません。どんな空気録音でも、よく聴いていくと、部屋の響きだったり低域の質やボーカルの質感、音の広がりや奥行き感など見えてきますが、正しい情報であっても、そこまで注意深く聴けさらに判断できる人は希といえましょう。今回の明らかなヘッドホンの録音ですらエイプリルフールに開催してもなお、半数近くの人がヘッドホンだと気づかなかったので、人の認知力やバイアスの不思議さ、環境や聴いて欲しいポイントを正しく表記することの重要性が感じ取れたと思います。

またこれまでも、空気録音はオーディオをネットで伝える術として最も優れた方法であると言ってはいますが、Youtubeに空気録音の動画をあげても再生数もれないし、再生時間が極端に短くなります。そんな空気録音ですが、今回のように偽装をおこない、さらにそこで利益につなげることは非常に難しいと思います。もちろんうまくコンプレッサーを入れたり、比較動画でよく聴かせたい方の音量を少し上げておくなどの不正は可能ですが、これは空気録音に限らず実際のデモンストレーションでも同じことが言え空気録音に限ったことではありません。ただそのような不正行為を続けることは将来性(インプライドオッズ)を考えた場合、期待値(EV)はマイナスに寄るかなと感じます。
今回はエイプリルフールの企画として上げましたが、これでもちょっと怒ってくるような人は一定数存在すると思います。
空気録音やオーディオの試聴はそれだけ曖昧であり非常に繊細な作業だと言えそうです。

結論

普通のスピーカーでの空気録音に見せかけた、ヘッドホンのバイノーラル録音を、ヘッドホンの音がするか尋ねると、人によっては普通にスピーカーに聞こえるけど、半数くらいの人は、完全にヘッドホンの音だと感じるという結果でした。結果を見たら、条件が不明瞭な空気録音は評価として意味をなさないと結論づけられそうです。
今回は「ラベリング効果」が強く働いたのかなと思います。オーディオの音はかなりマージナルな部分が多いので事実よりもラベリングの方が強く働くこともあると思います。
マジックやっていているとよく感じますが、そんな種でマジックが成立するのと不安になることは多いですが、人は突然起きたことなどは簡単に騙されてしまいます。それを見ているのがマジシャンだとしてもです。でも中には感覚が非常に鋭い人もいて、全てお見通しみたいなこともたまにあります。ただマジックも同じで、これから右手から左手にコインが移るのでみてといって実際にそうすると多くの場合、種が簡単に推測されます。これは、マジックの多くが人の無意識を利用したものであるからです。空気録音も同じで正しい情報を明記すれば例えそれが電源ケーブルの違いであったりちょっとしたアクセサリーの違いもわかる人にはわかるようになると思います。

さらには、今後のネット社会はAIの自動生成によって、人の意思や文脈から逸脱した非常にカオスな画像や映像、情報が飛び交うと思います。今回はエイプリルフールとして動画をあげたので察した人は多かったように思いますが、近年エイプリルフールのコンテンツが盛り上がらなくなったのは、今回の空気録音が50:50になり意味をなさなかったように、実は、もうすでにネットの情報は事実と違うもの、情報として価値のないものであふれているかもしれません。Googleで検索をかけるとしばしば詐欺サイトなどがヒットしますし、ネットの広告も、もうすでにAIが描いたモデルの絵が起用されてたりしています。
何が本当で何が真実なのか、今後のネット社会は今よりずっと混沌さを増していくと思います。そんな中それほどまでの情報量を取り扱えるほどのキャパがそんなにない人の脳はネットの情報の海に耐えられるのかいささか疑問に感じます。現在のTwitterでさえも昨日いいねやツイートしたことを全て覚えている人はまずいないでしょう。そして無数にあるツイートの中身をいちいち精査するなんてことは現実的ではありません。人は結構なんとなく物事を見ていると思います。混濁していくネットの情報が人々に大きなパニックを引き起こすまではそう時間はかからないと思います。もはや人類のインフラになったネットがそうなったときに世界はどうなるか?AIのすさまじい進化には非常に不安を感じます。

いかがでしたか?
ヘッドホンとスピーカーの音は全くの別ですが、ヘッドホンの音であってもマージナルな状況下では、スピーカーの音にも感じてしまい正しく判断することは非常に難しくなります。
文章も、絵や写真もはたまた動画や音声、音楽すらもAIで自動生成できるようになった世の中はどのようになっていくのでしょうか?ものすごい勢いであらゆる情報があちこちから発信される今、それが自分にとって意味があるのか正しいか全てを判断ができるのでしょうか?この文章すらもAIで自動生成されたものかもしれません。

余談

今回の企画たために、捨てようかなと思っていたHD800を4年ぶりくらい、おそらく引っ越してきて初めてHD800を真剣に聴きました。HD800を買ったのは2011年でもう12年も前のことですが、そのときは、ヘッドホンのリスニングもスピーカーでのリスニングも楽しんでいた頃です。試聴もせずに買ったHD800ですが素晴らしいオーディオ体験でした。それから802DSなどを導入していくとヘッドホンで音楽を聴くということからずっと離れていき、オーディオルーム作ったら完全にヘッドホンが必要ないものと思っていました。今改めてHD800を聴いてみるとこのくたびれたヘッドホンでもあの頃の感動がよみがえるような楽しい音でした。久々にヘッドホンで音楽が聴けていると感じましたし、素直にHD800って良いヘッドホンだなと思いました。バイノーラルマイクで空気録音をしてみたらHD800とG3 Giyaはあまりにも違う音なんですけど、リスニングしている感覚はなんとも表現しがたい四次元的な同じ感覚になります。
また、私のオーディオ体験の初期はヘッドホンで構成されているので、自ずといい音の基準をヘッドホンに寄せている感じはあると思います。ヘッドホンとスピーカーの音は同じになることはないですが、あのときヘッドホンで聴いた感動のそれを未だにスピーカーにまで求めているのかもしれません。