第1回 
文字、言葉の「総数」 
尾山 慎

好評発売中の『日本語の文字と表記 学びとその方法』(尾山 慎)。
コラム7本を収録していますが、そこでは語り尽くせなかった、あふれる話題の数々をここに紹介!
題して「文字の窓 ことばの景色」。

 

日本語の数を数える2つのハードル

 日本語は一体全部で何語あるのか。日本語は語彙が豊富などといわれるのを聞くことがあるが、筆者も授業や講座で尋ねられることがある。しかし日本語に限らずだが、これは2つの面から、にわかには答えにくい問いだ。まずひとつには、何をもって1語と数えるかである。ある人が10語とカウントしたのに別の人がそれを5語や7語と判定するのだったら、「総数」はなかなか見えてこない。たとえば「目頭」は1語だろうか。文字から見ると〝2語〟とカウントできるような気もするが、アクセントが一続き(め↓が↑し↑ら↓と、あがるところが一つだけ)なので運用上は1語とみなすのが普通だろうと思う。

 一方「まぶた」は、ほとんどの人が迷いなく1語だというだろう。が、語構成は「目+蓋」で、実は「目頭」と同じようなものだ。「目(め)me」が「目(ま)ma」にかわるのは複合語が作られるときにおきる現象で、「屋(saka>sake)」「綱(ta>te)」などがある。「睫毛まつげ」に到っては「目」+「つ」+「毛」で3つに分解しようとおもえばできる(「つ」は古い助詞)。それでも普通は1語とみなすに違いない。語構成を細かく分析できる人にかかれば、かなりの言葉が、複合してできた語とみなされることにもなる。

 上に、「目頭」が1語かどうか判定するのに、アクセントのことを持ち出したが、たとえば「つけまつげ」などは、やはりアクセントとして一塊だけれども(つ↓け↑ま↑つ↓げ↓)、どう考えてもこれは少なくとも2語(以上)から成っていると思える。「まつげ」の「ま」が「目」であることには気づかなくても、「つけまつげ」という語が何語からできるているかと分けてみるとき、「つけ」+「まつげ」という構造になっていることがわからないとは、さすがに考えにくい。何せ「まつげ」それだけでも使うわけだから。同じ複合でも、「付け/睫毛」は「目/頭」ほどには2語が密着していないような気がするだろう。

 日本語の総数は?という問いに対する、もうひとつの〝答えにくい〟理由は、語の集合の、その外縁を決めるのが難しいということである。これを読んでいる今この瞬間、あるところであらたな言葉が生まれているかも知れない。完全に新語でないにせよ、省略語だったり、あるコミュニティだけで通用する臨時的な組み合わせだったり、次々に生産されて、それが局所的に通用していたり、あるいはまた消えていったりもしていると考えられる。まるで、大きな池にやってきてはまた飛び立ち、少しの間も一定しない水鳥の大群を数えるがごとくである。だから、正確な数を確定的にカウントしきってしまうことなど、どれだけその池の鳥たちをじっと睨んでいても、なかなか決め打ちできず、キリが無い。それから、現在誰も話さないような古語はカウントに入れるのか入れないのか(今誰も話さない、という判定もかなり難しいが)。つまるところ、「日本語の」といったときに、「日本語」が何を指すのかという、まさにそもそも論からして問題になるということだ。ということで、一体何を根拠に、〝これで全部数えきったぞ!〟と見切りをつけていいのかわからないのだ。どこかの体育館に集まった人は2456人だろうが4872人だろうが、扉を閉めて出入りできないようにすれば1の位まできっちり数え上げられるが、言葉はなかなかそうはいかない。言い方をかえれば、どこかでなんらかの基準で見切りを付けて区切った集合を決めれば、数えようもあるということである。

 以上まとめると、何を1語とみなすかというのが決めにくいのと、どれだけを対象にしたグループを「日本語」の一集合とみなすかというのが決めにくいという二重の難点がある。決めにくい、というのは万人が納得するただ一つの合意があるとは思えないという意味である。こういった理由から、集まった人々の頭数を数えるような機械的カウントはそう簡単にはできない。

 現在、日本最大の(ということは世界最大ともいえるが)国語辞典は、小学館の『日本国語大辞典』(通称『にっこく』)で、全13巻およそ53万語収載されている。用例はのべにして約100万。万の位までの概数くらいならこのように、目安として示せる。この場合、グループの外縁を〈『日本国語大辞典』に収録されている〉と区切ったので、計上が可能になるわけである。なお、一つ確実に言えることがあって、それは、実際に存在する言葉としては、少なくとも『日本国語大辞典』の収録語数よりは多い、ということだ。この辞書は文字通り圧巻の分量だけれども、この辞典に載っていないが日常使う言葉というのは案外、ある。特に、俗語、外来語ならすぐにいくつか思いつくはずだ。載っていないことを確認するという不思議な辞書の引き方を、是非一度試してみて欲しい。ちなみに筆者は学生時代に、『日本国語大辞典』に、当の「にっこく」は載ってないんだな、そりゃそうかと妙に納得したことがある。ちなみに、「【日国】 日本の国。*聖徳太子伝暦〔917頃か〕上・推古天皇五年「救世大慈。観音菩薩。妙教流通。東方日国」」であれば載っている。

漢字の文字数は

 さて、以上と全く同じ問題を抱えているのが、「漢字は全部で何文字あるのか」という問いである。上の「日本語は何語ある?」と同様の難しさがあるが、それにしても興味が湧くのは間違いない。いろいろ難しいハードルがあるのはわかったけれど、それでも何文字あるんだろう?と知りたくなるのが人情というものだ。実はこれをカウントした研究がある。

 林大監修『図解 日本語』(角川書店 1982)では、漢字の部首別所属文字数ランキングが載っている。一位は、「くさ」部で、2137字所属。第20位が「魚」部で682字所属。この上位20部だけで、全体の44.5%を占めるという。

 「全体」だって?今、一瞬目を疑った方もおられよう。漢字の「全体」なるものは、もちろん上に述べた「日本語」同様、わからない。昔も今も、これからも、ただ一つの集合として得ることはできないだろう。ではどう数えたかというと、本書では、『大漢和辞典』(大修館書店)――約5万字が収録、二字熟語などの実例は約53万――を使ってカウントしたのだった。これだと「外縁」を区切って数えられる(しかも客観的だ)。字書においてではあるけれども、これだけ巨大な規模だと大いに参考になる数字である。『大漢和辞典』では、部首が214部あがっているが、そのうちの上位わずか20部だけで、のべ約5万字のうちの45%をも占めるとは驚きではないか。いかな漢字好きでも、漢字の中で、くさかんむりグループ字が1位で何文字所属かというのを含め、直観や勘だけで知っている(把握できる)人などまずいないだろうから、まさに貴重な学術研究による知見だといえる。


著者紹介

尾山 慎(おやま しん)
奈良女子大学准教授。真言宗御室派寳珠院住職。
著作に『二合仮名の研究』(和泉書院、2019)、『上代日本語表記論の構想』(花鳥社、2021)、『日本語の文字と表記 学びとその方法』(花鳥社、2022)。