「あいうえお」の違いは、声の高さでも舌の形そのものでもなく、声道の共鳴のピークがどこに立つかで決まる。低いほうから F1・F2 と呼ぶ2つの山、ほぼこれだけで母音が決まってしまう。
このページは二部構成。① 声の地図では F1・F2 の地図を直接ドラッグして母音を作り、音を鳴らす(フォルマント合成)。② 声道ラボでは逆に、声道を輪切りにしてその共鳴を管の形から数値で解く——F1・F2 が「どこから来るのか」を、形をいじりながら確かめる。← ほかのツール
※ このラボは、声道を1次元の損失なし管として近似したモデルです。唇の放射端補正、声道壁の損失、鼻腔結合、3次元形状、声門インピーダンスは省略しています。だから実測のフォルマントを厳密に再現するものではなく、形と共鳴の関係を見るための教材だよ。
もうひとつコツ:管を一様に太く/細くするだけでは、主に音響インピーダンスが変わるだけで共鳴周波数はあまり動かない。フォルマントを動かすのは断面積の絶対値より、どこが狭くどこが広いか(分布)のほうだよ。
声帯(左・閉じた端)から唇(右・開いた端)までの声道。輪郭のまる印を上下にドラッグすると、その場所の断面積が変わる。重なって見える曲線はF1 の圧力振幅分布とF2 の圧力振幅分布——どちらも今の形について、この1次元管モデルでの共鳴を数値で解いて描いたもの(各点で圧力がどれだけ振れるかの絶対値)だよ。
いまの管を声帯側から見たときの伝わりやすさ |H(f)| = 1/|D(f)| を周波数ごとに計算したもの。山が立つところ=共鳴=フォルマント。低いほうから F1・F2・F3。形を変えると、この山が左右に動く。これが「F1・F2 が出てくる理由」そのものだよ。
横が F2、縦が F1。あ・い・う・え・お の代表位置を置いてある。②の管を解いて出た F1・F2 が オレンジの点。母音ボタンを押すと、その母音“らしい”管の形に変えて、解き直した点がどこに着くかが見える。ぴったり一致しなくていい——このモデルで形から計算した値が、代表値とどれくらい近いかを見るのがこのラボの趣旨だよ(差は下のリードアウトに出るよ)。
声道を $N$ 個の輪切りに切る。1個は長さ $\ell$・断面積 $A_i$ の一様な管とみなす。その中を進む音波は、入口と出口の(圧力 $P$, 体積速度 $U$)が次の 伝達行列(ABCD行列) で結ばれる:
$Z$ は管の特性インピーダンスで、細い管ほど大きい(だから断面積の比だけが効く)。輪切りを声帯側から唇側へ順に掛け算すると、声道全体の行列が出る:
境界条件は、声帯側=閉じた端(体積速度を送り込む源)、唇側=開いた端 $P_{out}=0$。すると声帯から唇への体積速度の伝わりは $U_{lips}/U_{glottis}=1/D(f)$ になる。だから——
周波数 $f$ を端から端まで掃いて、$|D(f)|$ の谷を拾えば、それが F1・F2・F3。管が一様(中性管)なら $D=\cos kL$ なので、$\cos kL=0$ すなわち $kL=\tfrac{\pi}{2},\tfrac{3\pi}{2},\tfrac{5\pi}{2}$、つまり
が F1・F2・F3。これが「声帯側が閉じた管は奇数倍の1/4波長で鳴る」の中身だよ。ラボはこの計算を、君が動かした形に対して毎フレームやり直している。
F1・F2 が母音を決める主役(だから①の地図は2軸で足りる)。F3 以上は、声の個人っぽさや細かい音色を担う、3番目の共鳴。一様管なら $F3=\dfrac{5c}{4L}\approx2500$ Hz——5番目の1/4波長だね。
母音による F3 の動きは F1・F2 より小さく、比較的おとなしい。でも次のときに大きく動く:
・唇のすぼめ(円唇):出口が狭くなって、全体、特に F2・F3 が下がる。
・そり舌:英語の /r/ では F3 ががくっと下がる(F3 が低いのが /r/ らしさの正体)。
・前空洞の長さ:舌のくびれより前の空洞が長いほど、その共鳴(しばしば F3)が下がる。
だから日本語の母音は F1–F2 の地図でだいたい足りるけれど、子音・英語の r・話者の聞き分けには F3 が効く。②のラボは F3 も同じ伝達行列から一緒に解いているから、形を変えると F3 の山も動くよ(②の伝達関数グラフで確認できる)。
①では「F1=口の開き、F2=舌の前後」と調音(ちょうおん)で説明した。②では舌が出てこず、管の断面積の形だけで共鳴を解いた。矛盾しているわけじゃなくて——舌・あご・唇は、フォルマントを直接動かしているのではなく、声道の断面積 $A(x)$ を変えることで動かしている。その $A(x)$ が共鳴を決める。だから両者は同じ現象の別の層なんだ。
対応はこう:
・舌を前に出す → 前の方が狭い管 → F2 が上がる(①の「舌:前」=②の「くびれが前」)
・あごを開く/舌を下げる → 口側が広い管 → F1 が上がる(①の「口:開き」=②の「奥が狭く前が広い」)
・唇をすぼめる → 出口が狭い → F2・F3 が下がる
つまり ① は「筋肉が何をするか(調音)」、② は「その結果できた管が音響としてどう鳴るか」。② が ① の“なぜ”になっている。どこを狭めると各フォルマントがどっちへ動くか、を一般化したのが摂動理論で、それがちょうど①と②の橋渡しだよ。
補足:声の高さ(ピッチ=F0)は声帯の振動そのもので、ここまでの共鳴(声道の形)とは別系統。同じ「あ」を高くも低くも言えるのはそのため。声道の長さ L を変えると全フォルマントが $\propto 1/L$ で動く(子供は短いから高い)——これも形=音響の話で、F0 とは独立だよ。