昨年来、QUORAというサイトにはまっている。これはいろいろな人が短い質問を出し、それに対して回答したい人が書き込むというものだ。もちろん「GGRKS(ググれカス)」に近い回答も多いものの、同種のサイト(YAHOO知恵袋とか)に比べると総じて回答が本格的であって、質問者はそこまで期待していないだろうというような、大学論文や百科事典並みの回答が出てくることもあり結構面白い。読みだすと止まらず時間を無限に使ってしまうという「QUORA症候群」にはまる人も(私を含め)多いようである。
その中には音楽に関する質問もあり、私もたまに回答したりするのだが、回答を何人の人が読み、そのうち何名が高評価をしてくれているかということも分かるので、これまた癖になってつい書き込むことになってしまう。ちなみに多くの回答が寄せられた質問にはご褒美が出るが、回答者の方は全くのボランティア扱いのようだ。つまり、これは「他人に知識をひけらかしたい」という欲望を利用したものであって、そういう意味ではなかなかよくできたシステムである。
その中で私としてよく目につくのが音律の話である。オクターブの7音音階や12半音がどのようにして成立したかという疑問は比較的多くの人が抱くものらしい。私は拙著で音律成立に関して<音律は「ピタゴラス」ではない>という暴論を展開しているので、ついついひとこと言いたくなってしまうのだが、たまにそれに対する真面目な反論もいただいたりして、ますます病みつきになるという次第である。
その種の質問いくつかに断片的な回答を書き込んでいたのだが、いつまでたってもモグラ叩きのように似たような質問が出てくるので、今回総括版を作ることにした。それが下記の記事なのだが、折角書いたのでQUORAだけでなく今回ブログにもアップすることにする。私の意見はあまり一般的とは言い難いので、元のQUORAの他の回答者の(比較的常識的な)記事もご参照願いたい。長いので前半・後半に分ける都合上、若干元の記事と内容を変更している。
「ドレミファソラシド」の根拠はなんですか?12の音階のうち7つをピックアップするのはなぜですか?またアルファベットはA=ラから始まり、440Hzもラの音ですが、かつては短調が標準だったんですか?
ご質問の2番目の部分だけにしか答えておらず、ご質問からかなり脱線するかもしれませんので、初めにお詫びをお伝えしておきます。また、回答の内容について個々の用語等に詳しい説明を加える余裕がなく、ある程度の音楽知識の常識を前提にしている回答であることをご了承ください。QUORAで既に類似の質問のいくつかにお答えしていますので、この回答はそれらと基本的には同一ですが、今回は断片的な回答でなくまとめて私の考えている全体像を述べ、この種の質問への回答の総括としたいと思います。
まず、ご質問の後半ですが、ほかの方の回答にあるようにまず十二の半音が存在したのではなくその前にドレミの全音階が存在したということは確実だと思います。それでは全音階はどのようにして発生したのでしょうか? 昔の楽譜がなくかつ音楽論もそれほど古いものは残っていないようですので、はっきりしたことは言えないのですが、音律について書かれた本を読むとほとんどがピタゴラスからスタートしています。ピタゴラスは五度の音程を積み重ねること、例えばFから初めてF-C-G-R-A-E-Bというような系列を得、それをオクターブ内に整理してC-D-E-F-G-A-Bという全音階を得たというのが普通の説明なのですが、私はへそ曲がりなせいか、どうもそういうプロセスは考えにくいような気がしています。(私は専門音楽教育の現場とは無縁の人間なので、それを念頭に置いたうえで以下お読みください。)
音楽についての理論として最も古くまとまったもので現存しているのがピタゴラスの理論であるということから「音律はピタゴラスが作った」ということになるのかもしれません。しかし、ピタゴラスの定理がピタゴラスの発見ではないように、この言説も怪しいと思うのです。かつて甲骨文字の発見に伴い殷の武丁が漢字の発明者と言われたこともありますが、彼(?)が発明したのは「骨に文字を刻むこと」です。音楽にせよ美術にせよ文学にせよ、常識的にはまず演奏者とそれを聴く聴衆が存在し、そうしてできた作品についてその構成を評価するのが学者というものの役割です。ピタゴラスはもちろん学者であり演奏者として名前が記憶されているわけではありません。彼が現に存在する音楽についての理論を構築した功績(やや議論の余地はあると思います)があるとしても、ピタゴラス以前に音楽がなかったわけではもちろんありません。
残念ながら古代ギリシャ以前の楽譜と認められるものは非常に少なく、昔の歌がどのような音律で歌われていたかの実体の解明は難しいですが、例えば紀元前16世紀ごろメソポタミアの一部を支配したミタンニ王国を作ったフルリ人の楽譜というのがネットに公開されています。これは完全な七音音階(ディアトニック音階)で、しかもオルガヌムです!
これはその「楽譜」の解釈次第という問題があって、どこまであてになるかは分かりませんが、少なくとも古代オリエントやエジプトでディアトニックな音律の体系が確立していたことは確実視されているようです。
こういうディアトニックな体系がどうして作られたかですが、例えばリラのような楽器の調弦において上記のピタゴラス的な五度の積み重ねによる調弦が行われた、ということは十分考えられることです(現在でもバイオリンのような弦楽器では常識的に行われています)。このような五度の累積ないし「三分損益」(五度上昇と四度下降を繰り返す方式)によって上記のようなディアトニックな体系が成立する可能性はあります。しかしそういう楽器を正確に調律する技術は「歌」や「旋律」の発生に先行したのでしょうか? 楽器ができるまで人間は音程を正確に歌うことが出来なかったのでしょうか?
私は、そもそも人間がどのようにして「正確な音律」というものを獲得したかについて、一足飛びにピタゴラス的な段階を考えるのではなく、もっとプリミティブな段階を考える必要があると思います。人間にもほかの動物にも「絶対音高感」(いわゆる「絶対音感」ではなく)があり、高い音と低い音の区別がつきます。しかし「どの程度高いか、低いか」を把握するうえで、もちろん現代の音楽教育で教えるような絶対音感を持っていたわけではありません。普通、音高を把握する方法は二つの音を比較することで、その二つの音が隣接している(「旋律」)か、同時に鳴る(「和音」)場合であれば、比較も容易になります。
音の高低を利用する方法は音楽だけでなく言語にもあり、イントネーションとか声調という形で用いられていますが、せいぜい高いか低いか中間かぐらいで、正確な音の高さの把握というものではありません。しかし言語に使われる様々ないろいろな音の高さが「音楽」として利用されるようになると、その種類がどんどん多様化していき、それぞれを正確に把握することが必要になります。人は「広い音程」で歌うこともあれば「狭い音程」で歌うこともあり、そういういろいろな音程をどのようにして正確にコントロールできるかが、音律の成立を意味しています。
正確な音の高さの認識は上記のように「比較」によって成立するもので、その第一歩は「二人以上の人が同じ高さの音を出す(ユニゾン)」という方法です。その次は「オクターブ」で、男女がユニゾンで歌えば自然に発生するものであり、ここまでは特に「音律」という概念は登場しません。常識的に考えれば次に把握され確定するのは先ほどから何度も出てくる「五度」です。ピタゴラス的に言えば振動数比でユニゾン(1:1)、オクターブ(1:2)の次に来る音程で(2:3)ということになるわけですが、もちろん数学とは関係なく「中ぐらいの音程ではっきり分かるもの」ということで認識されるわけです。これには「音程」というものがもつ特殊なクオリアが感じられる(ハモる)ということが前提になります。
同様に四度(3:4)も類似のクオリアをもって認識されます(なぜならば、これはオクターブを同一視すれば同じ要素からなる音程だからです)。その次は長三度(4:5)なのですが、先のピタゴラス的発想では長三度は五度を4回積み重ねてそれを2オクターブ下げるという操作をして発生することになっています。私は三度のような比較的基本的な音程がこのような操作によらないと発生しなかったとは考えられないのですが、実際この「ピタゴラス三度」は「ハモる」音程ではありません。
しかしこの先(5:6、6:7、7:8…)になってくるとどんどん話がややこしくなるので、一旦ここで「広い音程」から目を転じて「狭い音程」の方を見てみましょう。昔の人は広い音程で歌うこともあれば狭い音程で歌うこともあったに違いありません。このような「狭い音程」として最初に確定し採用されたのが「全音」です。私は、これはすでに音程として確立した「五度」と「四度」の差として確定したと考えるのですが、ピタゴラス的発想においては五度を二度積み重ねてそれをオクターブ下げたということになります。結果的には同じことなのですが、なぜわざわざそんな複雑な操作をしなければいけないのか説明できるとは思えません。ある音に対して五度をなす音と四度をなす音の両方が使用されれば、必然的に「全音」という狭い音程が最初に生じ、それ故にこの音が「全音」すなわち「音程の単位」と呼ばれるようになった、と考えられます。
こうして、西洋や中国などの文明圏においては、広い音程の代表として五度とか四度とかが「音程の骨格」となり、狭い音程の代表として全音が「音程の単位」となります。その先は音楽史の教科書に載っているように、こういう五度や四度に対して「装飾音」としての全音が絡むような様式が成立します。例えばギリシャでは四度の枠組み(これを「テトラコルド」と呼びます)の中に全音2個をはめ込み、4つの音(例えばミ-レ-ド-シ)からなる単位が成立します。これを上下に置くことによって、完全なディアトニックな体系(例えば、ミ-レ-ド-シ/ラ-ソ-ファ-ミ)が成立します。
しかしながら、こういう操作を行うことによって「さらに狭い音程」の存在が否応なく浮き彫りにされることになります。例えば四度の上から全音を二つ置くとか、四度の両側から全音を置くとかした場合、残りの一つの音程は全音より小さな音程にしかなりません。もちろんこれが、我々が今日「半音」と呼んでいるものなのですが、例えばこのような操作をした場合、この「より狭い音程」は(3の5乗:2の8乗)という得体のしれないものです。
さて、ここでこの音律の成立史上最大の難問が登場します。それはこの「得体のしれないもの」がなぜ「半音」なのかという問題です。それについてご説明したいのですが、長いので一旦ここで打ち切って、残りは次回にさせていただきたいと思います。
コメントをお書きください