ことばの変化と正しさ

中垣：言ってた「さみしい」と「さびしい」についてやねんけど…

松田：はいはい。

中垣：「さみしい」って、たぶん正しい読みじゃないやん。国語の教科書でも広辞苑でも「さみしい」は出てこないはずやねん。

さみし・い【寂しい・淋しい】
〔形〕[文]さみ・し(シク)

サビシイの転。
Source: 新村出編（2008）『広辞苑第六版』岩波書店

もう解散でいいですか…？

松田：なるほど。

中垣：やねんけど、みんな使うやんか。で、教科書に載ってなくても慣用的に使われてるならOKじゃねって議論ってあるわけ。

河東：あるよね。

世間一般では今の国語の状況を「言葉の乱れ」ととらえることが多く,世論調査(平成4年総理府,同7年文化庁) においても「今の言葉は乱れている」と考えている人はおおむね7割を超えた。「言葉の乱れ」は,ある価値判断を伴ったとらえ方である。一人一人が自らの考える国語のあるべき姿に照らせば,そこから逸脱するものを「乱れ」ととることも率直な態度であり,言葉に対する関心の高さゆえのことと思われる。
　ただ,国語審議会としては,言語の変化を客観的にとらえ,変化の過程で,ある語について新たに生じた別語形が従来の語形と並存する状態については,これを基本的には言葉の「ゆれ」としてとらえた上で,現時点でのより適正な言葉遣いを考えていきたいと考える。
Source: 文化庁

中垣：これもまあそういう話と言えばそうやねんけど、「さみしい」の予測変換で「寂しい」が出るか試してみると、もちろん出るわけ。で、予測変換って機械学習というか、そういうふうに大量のデータを元に変換の精度を上げていってるわけやんか。

形態素解析 – Wikipedia

河東：うんうん。

中垣：だから、慣用的に使われているから教科書とか広辞苑に載せようっていっても、今までなら定量的な尺度がなかったわけやけど、今やGoogleで変換されるならそれはもう慣用的に使われてるってことやんか。だからそれを慣用的に使われていることの定義にしちゃっていいんじゃないかという話。

広辞苑としても、大事なのは日本語として定着しているかどうからしい

日本語として定着した語，または定着すると考えられる言葉を厳選．新加項目は約1万に達しました
Source: 岩波書店

松田：はいはい。なるほどね。

中垣：これまでの、教科書とか辞書に載ってる内容が実態と合わなくなったときに、それが著しくなってから発見して権威が修正を承認するみたいな、そういう旧来的なプロセスではなくて、シンプルにGoogleが書き換えていくというか、データが書き換えていくのでもいいんじゃないかって。

松田：データが書き換えていくことのミソは、誰もハンコを押していないってとこやんな。

中垣：そうそう。

松田：でもそれさ、言葉のポピュリズムじゃね？って言われたら反論できなくない？

言葉の戦国時代。「渋谷区ではマジ卍が覇権をとったらしいぞ」

中垣：じゃあさ、慣用的に使われる言語と教科書的に使われる言語は別のものとして存在していているべきだっていうこと？別に言語に関してはポピュリズムでいいと思うねん。みんなが使っているものこそが言葉なわけやん。

松田：あー…なるほどね。なんかそのやり方でいくと、言語の多様性が失われる気がして…

本文とはあまり関係ないけど、言葉の多様性は本当に大事。国立国語研究所の副所長が日本の危機方言について話した、ナショナルジオグラフィックの連載のリンクを貼っておきます。特に第2回の、皮膚感覚を通して季節を表現した「ヨカハダモッゴワスナ」のくだりは、言語の多様さの意義を感じさせてくれます。

第1回　6000言語のうち2500が消滅する！？
第2回　方言は「汚い言葉」？
第3回　今もありありと思い出すぼくの「言語喪失」体験
 第4回「方言」と「言語」の違いとは
 第5回　消滅危機言語をなぜ守らなければならないのか

中垣：いや、多様性は失われへんと思うで。さっき書き換えていくって言ったけど、というよりはむしろ、付け足していくって感じ。「さみしい」もあるし「さびしい」もあるねん。

松田：でもさ、「さみしい」と「さびしい」が併記されてても、より言いやすい「さみしい」の方が結局はメジャーになっていくと思うねん。みんなが使っているものこそが言葉ってスタンスやと、言語が単純になっていくと言うか…

モアイの特集もおもしろいし、危機言語の特集もおもしろいよ

『ナショナルジオグラフィック日本版』2012年7月号,日経ナショナルジオグラフィック社

中垣：それはまあ…そうね。ちょっと待ってな、今言ってるのはそんな応用的な話ではなくて、シンプルに「さみしい」も広辞苑に載せたらいいんじゃねって話やねん。それだけ。

中垣：ただ、これまでは言葉が慣用的に使われているって判断するにあたって、その線引きが難しかったわけやん。それを権威の承認なしに、データで定量的に判断できるようになったんじゃねって話。

このあとしばらく、広辞苑や教科書に載ることがまさに権威に承認されることであるのに、権威に承認された結果広辞苑や教科書に載るものとして話をしているため、ややおかしなことになっている感があります。また前述の通り、広辞苑では「日本語として定着した語，または定着すると考えられる言葉」を立項しているため、広辞苑に載ることと教科書に載ることは別の性格をもっていると考えた方がよさそうです。

河東：そのままじゃあかんの？広辞苑には載ってないけど、みんな使ってるし、Googleでも出る、みたいな。

中垣：別にそれでもいいねん。

河東：ガッキーが広辞苑に載せてもいいんじゃない？って言うのは、別に載っていないことで何か問題があるからではないねんな。

中垣：ではないねんけど…そもそも教科書における正しい読み方とか正しい文法を教える意味ってなんなん？そこで言われている正しさって何？つまり国語の教科書で「寂しい」って漢字を習ったときに、「さびしい」と「さみしい」を併記してはいけない理由って何？

河東：なるほどね。それを許すと…的な話なんかな。

中垣：けどそれも結構怪しくて、例えば音便とかはどうなんって話やん。

松田：まあ音便だって、一定以上にメジャーになったから一軍入りしたみたいなもんやしな。

音便音形上の分類と用例 – Wikipedia

中垣：たぶんそうやん。言葉っていうのは絶えず変化していくけど、それを50年100年スパンで見たときに、「あ、本当に変わって定着したんだね」って一区切りして辞書に載せてるだけで。

中垣：で、これまでは体感でしかそれを掴めなかったわけ。「さみしいってみんな言ってるけど、実際どれくらい使われてるの？」って。でも今みたいにみんながスマホで変換してると、どういう年代の人がどういう言葉を使っているっていうのがデータで取れるやん。しかも教科書に表記するやり方だって、例えば「ネットでは」とか「一般的にはさみしいでも通じる」とかって書いたらいいわけやん。

松田：うんうん。

中垣：これまでなら「一般的には〜」って何？って話やってんけど、今ならGoogleで変換されていることをもってそれを定義できるわけやん。だから別にいいんじゃない？って。

松田：どうなんやろ、それでも個人的には引っかかるな。実態がそうだというだけでは正当性は主張できないんじゃないかなって。やっぱり「さみしい」を併記することって、多少なりともそれを肯定するニュアンスを含むわけやし。

中垣：まあまあ。でも「さみしい」に関しては少なくとも書いていいと思う。だってみんなが使ってるから。そこで「マジ卍」まで入れるかってなったら、それはまた別の話やで。

その通り。「さみしい」は立項されているし、「マジ卍」は一生立項されない

中垣：まあ分からん。実際の話、教科書のアップデートみたいなことには興味がなくて…だからまあ教科書じゃなくていいかもね。教科書は今のままでよくて…

松田：だからあれやん、Wikipediaスタイルの広辞苑があればいいってことやん。

中垣：そう。そういう、もうひとつの判断基準があってもいいんじゃない？って感じに近い。

ブリタニカ百科事典とWikipediaの二本立てスタイル

ブリタニカ百科事典 – Wikipedia

河東：そうねそうね。

中垣：教科書のアップデートとか言語の氾濫みたいな話になると、正直おれもよく分からへんから。

河東：なんかでもさ、そうなるとめっちゃ手を講じることで、新語を流布させることもできるようになるというか、一般の人でも漢字の読み方を変えられちゃうみたいにならへん？

松田：ゆきぽよが謎ワードを使いまくるとか。

河東：まあゆきぽよだけじゃ無理やろうけど、例えば安倍晋三がゆきぽよに肩入れしたとしよう。

中垣：笑

河東：安倍晋三が「ゆきぽよの考えたこの言葉を私は正しいものにしたい」ってなって、記者会見で連呼してるうちに、みんなそれを使えるようになってしまったとか。

中垣：それは普通に昔からそうじゃない？

河東：そうか。

松田：だからあれやって、実態がどうなってるかをデータで取れるようになったんだからって話はまさにその通りで、ただそれを教科書的な基準として使おうとすると話がややこしくなる気がする。シンプルになんかおもろいことできそうって話でいいと思う。

中垣：そうやね。

松田：だからさ、選んだエリアごとのホットなワードを見れるとか、選んだエリアの選んだペルソナの変換を使えるとか、そういうのがあったらおもろいやん。

中垣：それで言うとさ、テキストマイニングだけで作られた広辞苑みたいなのができるやん。

Text mining – Wikipedia

松田：そうそう。

中垣：「だから」とかも、意味は全くインプットしないねんけど、マイニングの結果順接の接続詞であることが明らかになるとか、そもそも日本語の文法自体がテキストマイニングによって再構成されるとか。

松田：そうねそうね。それ誰かやってくれたらいいのにね。

自分では何もしない人達

河東：「みんなの使ってる言葉辞典」やな。

中垣：データをどこから取るかっていう問題はあるよね。Twitterが全力を出すしかない。

松田：Twitterベースなんむっちゃ嫌やな…

全てが140文字以内の、高度に論理的な文章がない世界線

中垣：Wikipediaとかにやってほしいね。Wikipediaの記事全部を元のデータにテキストマイニングをする。

中垣：あとは20世紀の文学作品でテキストマイニングとか、19世紀の文学作品でとか、そういうふうにしたら微妙な言語の移り変わりが分かりそう。

河東：はいはい。

とりあえずみんな、コーパスってものがあるのを知りましょう。コーパスとは書籍、新聞、ブログなどの様々なソースからなる自然言語の文章を構造化し、品詞などの情報を付与したデータベースです。国立国語研究所のコーパス開発センターの「小納言」は利用登録なしで無料で使え、「中納言」も利用登録さえすれば誰でも無料で使えます。

国立国語研究所
 小納言
 中納言

2020年5月30日
Aux Bacchanales 銀座

2018年に発売された『広辞苑第七版』。「雇い止め」「デトックス」「美品」など新たに一万項目を追加した。
製本機械の限界である8cmに厚さが収まるようより薄い紙を開発し、第六版と比べて140ページ増加したにも関わらず全体の厚さは変わっていない。