国語施策・日本語教育

HOME > 国語施策・日本語教育 > 国語施策情報 > 第21期国語審議会 > 第3回総会 > 次第・議事要録

次第・議事要録 協議1

清水会長

 両委員会とも勉強を始めたところだということである。
 それでは,資料5の「JIS漢字表について」の御説明をちょうだいしてから,御質疑いただきたいと思う。

氏原国語調査官

 今,先生方のお手元にある資料5「JIS漢字表について」と,もう一つ,先生方の机の上に載っている「漢字字体関係参考資料集」の二つを使って,私の方からJISの漢字表について御説明申し上げる。
 初めに,資料5を見ていただきたいのであるが,中身は大きく三つに分かれている。最初の1ぺージ,2ぺージは説明用のメモである。3ぺージ以降は,JIS漢字の問題では字形の変更ということがよく問題になるわけで,具体的にどんな文字が字形変更されたのか,第1次規格,第2次規格,第3次規格,すべて網羅したのが3ぺージから6ぺージまでである。最後の7ぺージ,8ぺージ,9ぺージは「JIS漢字の拡張計画」の部分で,先ほど第2委員会の論議の概要の中で,第3水準,第4水準という言葉が出てきて,どういうことなんだろうとお考えになった先生方もいらっしゃったと思うが, 第3水準, 第4水準を作ろうということで,今実際にJISの方で動き始めたところである。そのことが7ぺージ,8ぺージ,9ぺージに書かれている。
 資料については,このように三つに分かれているので,6ぺージまで,つまり現在行われているJISの規格票についての御説明と7,8,9ぺージの第3水準,第4水準のJIS の拡張計画,この二つの点についてお話し申し上げたいと思う。
 初めに,資料5の1ぺージを御覧いただきたい。これについてもなかなか複雑であるので,話す内容としては,最初に第1次規格,2番目に第2次規格,3番目に第3次規格と,それぞれの規格に即して説明していきたいと思う。
 まず,第1次規格,第2次規格,第3次規格ということであるが,そもそもJISの規格票というのは,「漢字字体関係参考資料集」の2ぺージ,表紙の裏に当たるところであるが,下から2行目に「なお,日本工業規格は,エ業標準化法第15条の規定によって,少なくとも5年を経過する日までに日本工業標準調査会の審議に付され,速やかに,確認,改正又は廃止されます」と書いてある。このようなJISの規定があるので,5年ごとに見直しをする。その結果として,確認で終わる場合もあれば,改正をする場合もある。場合によっては廃止ということも起こるということで,JISは5年ごとに新しい規格になっている。
 そういった関係で,資料5の1ぺージにあるように,一番最初にできた昭和53年のものが第1次規格,次に58年の第2次規格,更にそれを見直したものが平成2年に出た第3次規格といった形で2回変わっている。御参考までに申し上げれば,次は第4次規格ということになるわけであるが,現在の予定では平成9年,つまり年明けの1月に制定されることになっている。現行では第3次規格が実際に用いられている規格である。
 第1次規格のところに話を戻して,○のところにあるように,JISの漢字表については,先生方よく御存じのように,第1水準,第2水準の二つの水準に漢字が分かれている。昭和53年の時には第1水準漢字が2965字,第2水準漢字が3384字であった。
 そこで,まず最初に,第1水準の2965字,第2水準の3384字がどういうことで選ばれたのかということをお話ししたいと思う。どういうことで選ばれたのかということが分かることで, JISの規格票がどういった性格のものであるのかが理解できると思う。
 最初に,「KI=L1+L2 (A+B)……」というような式が書いてあるが,ここでまた,「漢字字体関係参考資料集」の116ぺージを御覧いただくと,116ぺージの真ん中よりやや下の3.2に「各水準の漢字は,次の基準によって選んだ」ということで,第1水準の漢字約3000字というのは, (a)一般の漢字表にあるもの, (b)地名人名の漢字表にあるもの, (c)内閣告示等に根拠を有するもの, (d)専門家の手による若干の調整。それから,第2水準の漢字約3400字についても, (a) (b) (c)というふうに挙がっている。

氏原国語調査官

 これだけでは実際にどういったものが選ばれたのかということが分からないが,118ぺージを開けていただくと,今のことがもう少し詳しく書いてある。3.2.3「第l水準重み28以上の漢字2000字を採用し,一般の表から700字,地名人名の表から200字を追加し,2900字を検討した。この漢字集合と個々の漢字表との関係を,各漢字表にない漢字の字数と各漢字表にあって採用しない漢字の字数とによって特微づけ,吟味し,この集合が妥当であるとの結論を得た」云々とあるが,その重みについては,話が前後するが,その前の117ぺージに載っている調査対象となった漢字表一覧で御説明したいと思う。
 JISの漢字表を作るときに,情報交換ということが目的であるから,実際に世の中ではどういった漢字が使われているのかということを調査する必要があって,ここに挙がっているような37の漢字表を集めてきた。そして,それぞれの漢字表の中にどういう漢字が用いられているかといったことを分析しているわけである。そうすると,ある漢字が1から37までの漢字表の全部に出ていれば,重みは37ということになるわけであるが,「注」にあるように,重みの幅は1から36である。これは,1から37まで並んでいる漢字表のうち,26番に「菅野謙「当用漢字表に含まれない漢字」く放送で使う漢字の範囲の検討のために>」という資料があり,それから,33番に「当用漢字表」が入っているからである。つまり,26番は当用漢字表に含まれていない漢字,33番はその当用漢字表に入っている漢字ということで,26番と33番の両方を満たす漢字はないわけである。したがって,どの表にも出てくる漢字というものは最大で36になる。こういったことで,頻度分析というか,JISの言葉で言うと,重みが明らかにされているわけである。
 また118ぺージに戻ると,どの漢字表にもよく出てくる漢字ということで,重み28以上のものが2000となっている。それが,先ほど見ていただいた「重み28以上の漢字2000字を採用し」ということの中身である。最終的には調整を加えて2965字としたわけであるが,もう少し詳しく,これらの漢字がどのように選ばれているかを明らかにしたものが,先生方のお手元にある資料5の1ぺージの,四角で囲んだ数式である。これは,昨年の11月に出されたJISの改正案説明資料に載せられているものである。
 その式を見ていただきたいのであるが,K1というのは2934字。これは後で調整を加えて2965字になるわけだけれども,どんなふうに選ばれているかというと,まずL1である。これは今見ていただいたように,28以上の重みを持つ漢字のことで1972字ある。それから,A群漢字表,B群漢字表。この辺にJISの特微が表れていて,こういったことは解説の中にきちんと書かれていないが,37の漢字表をA群,B群の二つに分けているのである。A群はどういうものかというと,※に書いたけれども,国土行政区画総覧と日本生命の漢字表以外の漢字表のことを指している。つまり,地名と人名の漢字表を外した残り35の漢字表をすべてA群と呼んでいる。そして,地名と人名の漢字表をB群と呼ぶわけである。したがって,37の漢字表を集めたと言いながら,35の漢字表と地名・人名の二つの漢字表が同じ重さになっている。ここにJIS漢字表の特微的なところがある。
 そして,国土行政区画総覧というのは,「字体関係参考資料集」の117ぺージを見ていただくと分かるのであるが,11番にあって,「国土行政区画総覧使用漢字」ということで3251字入っている。その二つ下,13番に「日本生命収容人名漢字」がある。そういうわけで,第1水準の漢字選定に当たっては,11番と13番が非常に重要な働きをしているのである。
 また資料5の1ぺージ目に戻るが,その中で, L2(A)は, A群の漢字表(35の漢字表)で重み順に上位728字,L2(B)というのは,B群の二つの漢字表の両方に出てくるもの728字のことである。次にL2(A+B)というのは,L2(A)とL2(B)に共通する漢字のことで,実は494字が共通している。つまり,これがそのまま第1水準に入る。そしてL2'(A),L2'(B)ということで,共通でない(A)だけにある漢字が234字,(B)だけにある漢字が234字という形で,これも第1水準に選ばれているわけである。
 したがって,JISの解説では,一般の漢字表から700字,地名人名の漢字表から200字選んだという形で記述されているわけである。つまり重み順に,まず2000字選んで,その後に一般の漢字表から700字,それから地名人名の漢字表から200字選んだと書いてあるのだが,700字と書いてある部分は,共通しているものが494字ある。だから見方を変えると,解説では,一般の漢字表から700字,地名人名の漢字表から200字選んだとなっているが,逆に,一般の漢字表から200字,地名人名の漢字表から700字選んだと読み替えてもいいわけである。494字は共通しているからである。こういうふうに見ていくと,地名人名に非常に重きを置いた漢字表であることが分かる。すなわち,固有名詞に非常に配慮した漢字表になっている。JISの漢字表は,一般に用いられる漢字プラス固有名詞用の漢字を対象としたものである,というように読むことができるわけである。
 更にそれがはっきりするのは第2水準の選び方である。「字体関係参考資料集」の118ぺージを御覧いただくと,3.2.4に「第2水準」というのがある。ここに「以下の表にある漢字の和集合から第1水準の漢字を除いた3600字を基礎とし,個々の漢字を吟味して第2水準漢字集合を定めた」ということで,実は第2水準に関しては37の漢字表の重みというのは何の意味も持っていない。実際に使ったのは,そこにある行政情報処理用基本漢字の2817字――これは前のぺージを見ていただければ分かるが,それと情報処理学会標準コード試案の6086字,それから地名人名に関する表。「地名人名に関する表」となっているのは,今第1水準で出てきた国土行政区画総覧の漢字と日本生命収容人名漢字のことである。つまりこの四つの漢字表から選んできて,第1水準に採られた漢字を除いたもの。こういった形で,第2水準が選ばれている。そういうわけで,第1水準,第2水準というものは,固有名詞にかなり配慮した漢字選定になっていることがお分かりいただけると思う。

氏原国語調査官

 もう一点だけ第1次規格のことでお話し申し上げたいのは,118ぺージのところにある3.3「漢字の異体字の取扱い」のことである。JISのコード表については,例えば二つの異体字があったときに,ニつともコード番号が振られているものと,それが一つになってしまって,もう一つの字がコード表の中に入っていないものとがあって,非常に不統一な感じを受けるという御指摘がある。漢字の異体字をどう取り扱ったかということについて,3.3のところに,その原則が書いてある。
 そこでは,異体字関係にあると認められる二つの漢字について三つに分けている。まず独立の関係,2番目は対応関係,3番目は同値。つまり同じ字だと認められたものは,コードポイントが一つしか付かないということになるわけである。
 具体的な例で見ていただくと,解説表4 「独立の異体字の例」に,両方とも第1水準にあるもの,例えば「富・冨」は,両方とも第1水準にあってコード番号がそれぞれ振られている。それから「峰・峯」,「島・嶋」,これらも「富・冨」と同様,既に人名で使い分けられているから,別個のコードを振る方がいいだろうということで,それぞれにコードを振っている。似たようなものがその下に並べられている。
 それから,解説表5には,対応関係にあるものということで,当用漢字の字体といわゆる康熙字典体,「応・應」「会・曾」といった形で,これは先頭にあるものが第1水準。
 そして,解説表6にあるのが,字形の違いがわずかであると認めるものの例ということで,点画の方向・長短・曲直等の違い,点画の接触・交差関係の違い,それから「花」などのクサカンムリの上の部分を3画で書くか4画で書くか。こういったものは字形の違いがわずかであるということで,同値関係というように認定している。こういったものは,結局コードポイントは一つしか付かない。
 もともと37の漢字表から集めてきているので,いろいろな漢字が字形差も含めて,集まってきているわけである。それをどう整理していくかというところで,異体字関係については, 今言ったような独立か,対応か,同値かの三つに分けて,同値関係のものはコードポイントが一つしかないということになっている。なお,これに関連して116ぺージにある,「この規格は,文字概念とその符号を定めることを本旨とし,その他字形設計等のことは範囲としない。」とされていることについても,紹介しておきたいと思う。
 第2次規格の話に移るが,資料5に書いてあるように,昭和58年9月1日に制定されている。そして,字種としては第1次規格に4字追加されている。「」,この右肩にある小さな1とか2というのは何かというと,もともと第1水準にこれらの康熙字典体が入っていたのが「1」,第2水準に入っていたのが「2」である。「槙」も,康熙字典体としては「槇」である。この康熙字典体が第1水準に入っていた。ところが人名漢字に「槙」が入ったために,もともと「槇」の入っていたコードポイントを人名漢字に譲ったのである。「漢字字体関係参考資料集」の36ぺージを御覧いただきたいのだが,区点番号で言うと,84区の01,02,03,04の四つの漢字が第2次規格で付け加えられたわけである。見ていだたくと分かるように,これらはすべて下に異体字の区点番号が付いていて,例えば84区の01だと,「堯」の字の下に22-38とある。この22-38というのはもともと「堯」という字が入っていた区点番号である。それが人名漢字としては,簡略化した形(尭)で入ったために,22-38という区点番号を人名漢字の字体に譲って,もともと入っていた康熙字典体は後ろに回された。それが84区の01で,02,03,04も同様の経緯で,それぞれ元の康熙字典体がここに入っているのである。
 ついでに申し上げると,第3次規格では更に2字増え,それが,84区の05,06,つまり「凛」と「熙」というわけである。
 したがって,字の数だけで言うと.第1次規格の時には第2水準の漢字は3384字だったのが,第2次規格では3388字,そして第3次規格,すなわち現行の規格では3390字になっている。こんなふうに変わっているわけである。
 そして第2次規格で特に問題になるのが2点あって,そこに挙げている。一つは字形の変更があったこと,もう一つは,下の○にあるように,コード番号の入替えがあったということである。
 実際に字形変更があったのは299字。先ほどちょっと御説明申し上げたが,資料の4ページを御覧いただきたい。そこに「1983年改正での字形変更」とあって,299字をすべて挙げている。先生方のお手元に「漢字字体関係参考資料集」があるので,第1次規格で,例えば18-93()とか,いろいろな区点番号があるけれども,第2次規格ではそれがどう変わっているのかというのを同じ区点番号で見ていただくと,具体的に分かるわけである。第2次規格の方には変わった後の字形(拐)で挙げているので,そのつもりで見ていただくとよいと思う。また,資料5の1ぺージに戻っていただきたい。

氏原国語調査官

 よく話題になる「鴎・」という字だけでお話し申し上げる。もともと「鴎・」に類するような「欧・歐」とか,「枢・樞」とか,「区・區」などは,第1次規格のときはそこの資料5にあるような形で入っていた。つまり一番上の「欧・歐」で言うと,18区に「欧」ー56年のときには「常用漢字表」になったわけだが,「常用漢字表」で採られている字体が入っている。そして,それの康熙字典体の「歐」が61区に入っている。その下の「殴」も,同じく康熙字典体と略体の両方が入っていた。そして18区の10というところに「鴎」という字が入っていたわけである。これらを御覧になると,実はここでの字体認識として,「區・区」というような,いわゆる康熙字典体と略体とは,別字体であるという認識があったことが分かる。つまり別のコード番号を振っているということであるから,この二つはさっきお話しした対応の関係にある。すなわち「区」と「區」の形は別の字体なんだという字体認識が,第1次規格のときにはあったわけである。したがって,「」の形を「鴎」の形にするとすれば,当然もう一つ別のコード番号を「鴎」に振って,「」とは別のコード番号として処理すれば混乱はなかったわけであるけれども,第2次規格ではもともとあった18区の10の「」をそのまま略字の形「鴎」にしてしまった。つまり最初の第1次規格のときにあった字体認識の基本原則をそこで破る形になったとも言えるのである。18区の10にはそのまま「」を人れておいて,第2水準の方に「鴎」を人れておけばよかったのではないかと考えることもできるわけである。
 略字にした「鴎」を第2水準の方に入れるというのはどういうことかというと,これもかなりー般に誤解されていると思うが,「参考資料集」の118ぺージ,「(2)対応」の(a) (b) (c)と挙がっているところである。 (a) 「当用漢字等では,新字体を第1水準に,旧字体を第2水準におく」。この原則に従って,先ほど見ていただいた「欧・歐」とか「殴・毆」という字はすべてこのようになっている。(b)「その他の文字では,本字を第1水準に,俗字・略字等を第2水準におく」。こういう基本方針がある。JISは何でも略体を入れたというような誤解を招いているところがあるが,実は対応関係にあるものでも,当用漢字表にある字とそれに入っていないいわゆる表外字とでは扱いが違っていて,その他の文字では,実は康熙字典体の方を第1水準に入れて,略字の方は第2水準に入れる。こういう基本原則で貫かれていたわけである。したがって,「」のような表外字は基本的には,康熙字典体が第1水準に入るわけである。ただし,これは第2次規格の解説を読んでいただくと分かるが,例えば「鴎」などについては,常用漢字に準じた形で字形変更したのだと書かれている。ただ,常用漢字に準じるのはどこまでの範囲かは一般にはなかなか分かりにくい。そこで,表面的に見ていくと,なぜそういうことが起こったのかということが問題になるわけである。
 もう一つ,22組の入替えのところであるが,例えば「鯵・鰺」という字で言うと,第2次規格では16区の19(鯵)と82区の45(鯵)となっている。もともとは,今の(b)の関係にあるわけで,いわゆる康熙字典体の方が第1水準に入って,そして略字の方が第2水準に入っていた。それを入れ替えたわけである。なぜ入れ替えたのかというのは,説明されている資料によると,第2次規格は58年に出たのであるけれども,資料5の2の(1)(2)にあるように,昭和56年の常用漢字表で新たに95字が,それまでの当用漢字表に追加された。そして同じく昭和56年に人名用漢字が54字追加された。この追加された字が略字体であった。したがって,第1水準はなるべく略字体にそろえたいという考えが基本方針となって,もともと第1次規格で持っていた方針とは少し異なる形になったということである。

トップページへ

ページトップへ