声のページ — 母音とフォルマント、そして声道の共鳴

「あいうえお」の違いは、声の高さでも舌の形そのものでもなく、声道の共鳴のピークがどこに立つかで決まる。低いほうから F1・F2 と呼ぶ2つの山、ほぼこれだけで母音が決まってしまう。

このページは二部構成。① 声の地図では F1・F2 の地図を直接ドラッグして母音を作り、音を鳴らす（フォルマント合成）。② 声道ラボでは逆に、声道を輪切りにしてその共鳴を管の形から数値で解く——F1・F2 が「どこから来るのか」を、形をいじりながら確かめる。← ほかのツール

① 声の地図 — 母音はフォルマント2つで決まる

横が F2（舌の前後）、縦が F1（口の開き）。点をドラッグすると、声帯のブザー（のこぎり波）を F1・F2・F3 のバンドパスに通した音が鳴る——これがフォルマント合成。「い」のあたりに動かすと「いー」に聞こえる。あ・い・う・え・おの位置も置いてあるよ。

声の高さ120Hz

では、その F1・F2 は声道のどこから来るのか？昔ここに置いていた「管の絵」は、じつは F1・F2 から逆算したマンガで、形と音はゆるくしか結びついていなかった。↓ の声道ラボでは逆に、管の形から共鳴を計算する。同じモデルから図も音も作っているので、少なくともモデルの中では形・共鳴・音が一貫している。形をいじって、上の地図の母音に近づけてみよう。

② 声道ラボ — その共鳴を、管の形から“解く”

※ このラボは、声道を1次元の損失なし管として近似したモデルです。唇の放射端補正、声道壁の損失、鼻腔結合、3次元形状、声門インピーダンスは省略しています。だから実測のフォルマントを厳密に再現するものではなく、形と共鳴の関係を見るための教材だよ。
もうひとつコツ：管を一様に太く／細くするだけでは、主に音響インピーダンスが変わるだけで共鳴周波数はあまり動かない。フォルマントを動かすのは断面積の絶対値より、どこが狭くどこが広いか（分布）のほうだよ。

管の形をさわる（上の輪郭を上下にドラッグ）

声帯（左・閉じた端）から唇（右・開いた端）までの声道。輪郭のまる印を上下にドラッグすると、その場所の断面積が変わる。重なって見える曲線はF1 の圧力振幅分布とF2 の圧力振幅分布——どちらも今の形について、この1次元管モデルでの共鳴を数値で解いて描いたもの（各点で圧力がどれだけ振れるかの絶対値）だよ。

声の高さ120Hz

声道の長さ L17.5cm

解いた共鳴（伝達関数）

いまの管を声帯側から見たときの伝わりやすさ |H(f)| = 1/|D(f)| を周波数ごとに計算したもの。山が立つところ＝共鳴＝フォルマント。低いほうから F1・F2・F3。形を変えると、この山が左右に動く。これが「F1・F2 が出てくる理由」そのものだよ。

母音の地図に重ねる（①と同じ地図に、解いた点を置く）

横が F2、縦が F1。あ・い・う・え・おの代表位置を置いてある。②の管を解いて出た F1・F2 が オレンジの点。母音ボタンを押すと、その母音“らしい”管の形に変えて、解き直した点がどこに着くかが見える。ぴったり一致しなくていい——このモデルで形から計算した値が、代表値とどれくらい近いかを見るのがこのラボの趣旨だよ（差は下のリードアウトに出るよ）。

声道ラボは何を計算しているのか

声道を $N$ 個の輪切りに切る。1個は長さ $\ell$・断面積 $A_i$ の一様な管とみなす。その中を進む音波は、入口と出口の（圧力 $P$, 体積速度 $U$）が次の 伝達行列（ABCD行列） で結ばれる：

$\begin{bmatrix}P_{in}\\ U_{in}\end{bmatrix}=\begin{bmatrix}\cos k\ell & jZ\sin k\ell\\[2pt] \dfrac{j}{Z}\sin k\ell & \cos k\ell\end{bmatrix}\begin{bmatrix}P_{out}\\ U_{out}\end{bmatrix},\qquad k=\frac{2\pi f}{c},\quad Z=\frac{\rho c}{A}$

$Z$ は管の特性インピーダンスで、細い管ほど大きい（だから断面積の比だけが効く）。輪切りを声帯側から唇側へ順に掛け算すると、声道全体の行列が出る：

$M=\prod_{i} M_i=\begin{bmatrix}A & B\\ C & D\end{bmatrix}$

境界条件は、声帯側＝閉じた端（体積速度を送り込む源）、唇側＝開いた端 $P_{out}=0$。すると声帯から唇への体積速度の伝わりは $U_{lips}/U_{glottis}=1/D(f)$ になる。だから——

$\text{共鳴（フォルマント）}\;=\;|D(f)|\ \text{が極小になる}\ f$

周波数 $f$ を端から端まで掃いて、$|D(f)|$ の谷を拾えば、それが F1・F2・F3。管が一様（中性管）なら $D=\cos kL$ なので、$\cos kL=0$ すなわち $kL=\tfrac{\pi}{2},\tfrac{3\pi}{2},\tfrac{5\pi}{2}$、つまり

$f=\frac{c}{4L},\ \frac{3c}{4L},\ \frac{5c}{4L}\ \approx\ 500,\ 1500,\ 2500\ \text{Hz}\quad(L\approx17.5\,\text{cm})$

が F1・F2・F3。これが「声帯側が閉じた管は奇数倍の1/4波長で鳴る」の中身だよ。ラボはこの計算を、君が動かした形に対して毎フレームやり直している。

F3 ってなに？

F1・F2 が母音を決める主役（だから①の地図は2軸で足りる）。F3 以上は、声の個人っぽさや細かい音色を担う、3番目の共鳴。一様管なら $F3=\dfrac{5c}{4L}\approx2500$ Hz——5番目の1/4波長だね。

母音による F3 の動きは F1・F2 より小さく、比較的おとなしい。でも次のときに大きく動く：

・唇のすぼめ（円唇）：出口が狭くなって、全体、特に F2・F3 が下がる。
・そり舌：英語の /r/ では F3 ががくっと下がる（F3 が低いのが /r/ らしさの正体）。
・前空洞の長さ：舌のくびれより前の空洞が長いほど、その共鳴（しばしば F3）が下がる。

だから日本語の母音は F1–F2 の地図でだいたい足りるけれど、子音・英語の r・話者の聞き分けには F3 が効く。②のラボは F3 も同じ伝達行列から一緒に解いているから、形を変えると F3 の山も動くよ（②の伝達関数グラフで確認できる）。

①の「舌の開き」と ②の「声道の形」は、同じことの二つの見方

①では「F1＝口の開き、F2＝舌の前後」と調音（ちょうおん）で説明した。②では舌が出てこず、管の断面積の形だけで共鳴を解いた。矛盾しているわけじゃなくて——舌・あご・唇は、フォルマントを直接動かしているのではなく、声道の断面積 $A(x)$ を変えることで動かしている。その $A(x)$ が共鳴を決める。だから両者は同じ現象の別の層なんだ。

対応はこう：

・舌を前に出す → 前の方が狭い管 → F2 が上がる（①の「舌:前」＝②の「くびれが前」）
・あごを開く／舌を下げる → 口側が広い管 → F1 が上がる（①の「口:開き」＝②の「奥が狭く前が広い」）
・唇をすぼめる → 出口が狭い → F2・F3 が下がる

つまり ① は「筋肉が何をするか（調音）」、② は「その結果できた管が音響としてどう鳴るか」。② が ① の“なぜ”になっている。どこを狭めると各フォルマントがどっちへ動くか、を一般化したのが摂動理論で、それがちょうど①と②の橋渡しだよ。

補足：声の高さ（ピッチ＝F0）は声帯の振動そのもので、ここまでの共鳴（声道の形）とは別系統。同じ「あ」を高くも低くも言えるのはそのため。声道の長さ L を変えると全フォルマントが $\propto 1/L$ で動く（子供は短いから高い）——これも形＝音響の話で、F0 とは独立だよ。