上位3文字「い」「う」「ん」
それでは、いよいよ新下駄配列のかな配置を具体的に決めていきます。
まず、出現順位上位3文字の「い」「う」「ん」の配置場所を決めます。この3文字の特徴は、なんと言っても出現率が非常に高いことです。したがって、押しやすいキーに配置します。
2-gramを見ると、この3文字はさまざまな文字と多く連なることがわかります。したがってこの3文字は、押しやすい連接を多く持つキーに置くべきです。具体的には、人差し指のホームポジション[J][F]です。例えば[J]は、[K][L][;][I][O]など、押しやすい連接になるキーを多く持ちます。
よって、「い」「う」「ん」のうちの2文字は[J][F]に置くことにします。
「う」は、拗音受けの「ょう」という連なりが非常に多く出現します。2-gramの中では、「ょう」が一番に、それも圧倒的に重要です。100万字日本語かなn-gramデータの2-gramで「ょう」は15003で1位。2位の「てい」は7484です。
拗音シフトが[I][O]なので、「う」を[J]に配置することで、拗音シフトと「う」がアルペジオとなり、「ょう」が非常に入力しやすくなります。
よって、「う」は右手人差し指の[J]に配置します。
「ん」は人差し指のホームポジションに配置すると多くの連接で非常に押しやすくなるという感触を得ています。したがって「ん」は、もう一つの人差し指のホームポジションである[F]に配置します。
「い」は、人差し指ホームが埋まったので、中指ホームのどちらかに置きます。連なりを見ると、「い・ん」(2838)より「い・う」(5147)の方が多いので、「い・う」をアルペジオで打てるようにするため、「い」を[K]に配置します。
【これまでに決まった配置】
〔単打〕
□□□□□ □□□□□□
□□□ん□ □うい□□
□□□□□ □□□□□
たった3文字の配置ですが、この3文字の配置は最大に重要です。
高頻度文字が入力しやすいことは、どんな文章を入力するときでも必ず効いてきます。「「ん」は文頭・文節頭では出現しないのでホームから外す」や「「う」と「ん」は高頻度文字のわりには連なることが少なく、連なる文字の傾向も似ているので、同指に置く」などの要請もありますが、それでも高頻度文字が入力しやすいことを優先します。
100万字n-gramデータの1-gramの出現回数を見ると、上位の方に、1つ順位が下がるだけで出現回数が大きく減る部分があることが分かります。1位の「い」の出現回数は74569、2位の「う」は59031ですので、1位と2位の差は5ケタで15538。3位の「ん」は58709で2位と微差ですが、4位の「か」は39537ですから、3位と4位の差はまた5ケタの19172です。そして、こんな大きな数字が出てくるのは、これが最後です。
このあと数字を見て悩む場面は山ほど出てきますが、そのときに使う数字は、せいぜい1000~5000程度です。3桁の数字で迷うこともあります。
そんな細かいところよりも、5桁の数字の選択を最大に優先するべきです。「ん」と「か」の約19000差がある文字の配置で失敗してしまえば、3桁の数字で最善の選択をできたとしても、焼け石に水です。逆に言えば、高頻度文字の配置さえうまくいけば、数百の数字の部分で理想の配置ができなかったとしても、大したことはないのです。
ます高頻度文字に最高の場所を与える。他の部分はそれから考える。新下駄配列はこのような考え方で作成します。
※かっこで囲まれた数値は、100万字n-gramデータの、1文字に対しては1-gram、2文字に対しては2-gram順不同の数値です。今後も同様です。
■新下駄配列作成記 目次