ラジオのはなし 聴取率測定編(第7回)

VRDigest編集部
VRDigest編集部
  • facebook
  • facebook
  • Twitter
  • HatenaB!

※本記事は2000年に発刊したVR Digestに掲載されたものです。

~音声比較方式その3

 今月は簡単な音声比較の実験をしてみましょう。

【素材作り】

まずウインドウズマシンに付属している、「サウンドレコーダー」というデジタル録音のソフトを使い、マイクで自分の声を録音してみました。

図1が「ダイジェスト」と発声した私の声です。横軸が時間。縦軸は振幅値で、音声パワーと考えていただいて結構です。私はごく自然に発音したつもりでしたが、このように機械で見ると「ダイ・ジュス・ト」と3つの音節にきれいに分かれて見えます。

vol383_14.jpg

「サウンドレコーダ」は録音したデータをWAVファイル形式でファイルとして保存できます。

WAVファイルは時間の経過順に、この音声パワーの値がずらりと詰まっています。ただ16進数で記述されたバイナリーファイルと呼ばれるものなのでメモ帳やワープロソフトでは見ることができません。この図1はある変換プログラムを使って、Wファイルをエクセルに読みこみ、エクセルのグラフ機能で描画したものです。

 以下エクセル上で音声比較の実験を進めます。

【比較結果】

さてこの波形を「ダイ」「ジェス」「ト」の3つのブロックに分けてみます。この時、各ブロックの 長さは同じになるようにしました。互いに比較しやすくするためです。そしてこの3つのブロック間での相関係数を計算してみます(表1)。相関係数とは-1から+1までの値をとり、両者がどれほど似ているかを示してくれるとても便利な数値です。相関係数が1に近づくほど、両者は「より似ている」と判断します。「ダイ」と「ダイ」の比較は同じ物ですから当然1です。

 しかし「ダイ」と「ジュス」のように異なる音声は0付近まで低下します。

vol383_15.jpg

【対維音性能】

「ダイ」と「ダイ」なら相関係数は1になりました。しかしこれはあくまで机上の話です。実際にはいろんな雑音が加算されます。そこでエクセルで乱数を発生させてこれを加算させてみることにします。発生させる乱数の最大値を次の条件にしました。

    1)乱数の最大値が声データの最大値の5%

    2)乱数の最大値が声データの最大値の10%

    3)乱数の最大値が声データの最大値の20%

 乱数を加算した様子を図2その相関係数を壷2に示します。

vol383_16.jpg

10%ぐらいまでの雑音ではそれほど影響ないようです。

【時間ずれ】

ラジオ聴取率を測定する場合を想定してみましょう。2台のラジオ(対象者のラジオと測定機のラジオ)で同じ放送局を受信し、その音声を比較する場合において、両者に時間軸のズレはほとんどありません。これは先月号でお話しました端末比較方式と呼ばれる方法です。

しかしセンター比較方式と呼ばれる方法では、端末装置で録音した音声をセンター施設へ送り、あらかじめセンターで録音してあった24時間録音マスターと時刻目盛を合わせて比較する方法です。どんなに精度の高い時計装置を使っても両者に完全なる同一時刻目盛を打つことは非常に難しい技術です。ではいったいどの程度の時刻ずれで、どれぐらい相関係数が劣化するのかを見てみましょう。

「ジェス」同志の比較において片方の「ジュス」データだけ区間をエクセル上で1セルづつ前後に移動させてみました。今回の実験ではデータ1セル間の時間は約一万分の1秒です。

結果は以下のようになりました。

vol383_17.jpg

このように1万分の1秒の遅延でもかなり劣化します。

音声の時間軸合わせは非常に重要です。続きは来月号で。

技術開発部  田中 博

この記事をシェアする
  • facebook
  • facebook
  • Twitter
  • HatenaB!