新下駄配列作成の原則
後半では、なぜその文字がそこに配置されたということも書くつもりです。が、しばらくは具体的な配置の話ではなく、抽象的な話が続くと思います。捉え所のない話になるのであまり面白くないかもしれません。しかし、この部分を書かずして具体的な配置の決定理由を書くことはできないので、順番に書いていくことにします。
まずは、土台となる新下駄配列作成の原則についてから始めます。
まず、新下駄配列を作成していく上で、どのような原則で作成していくのかを決めました。
新下駄配列は、次の3つの原則で作成しました。
文字の配置を考えたり、実際に使ってみる前に、新下駄配列をどのような配列にするのか方針を立てます。シフト率は少ない方がいいのか多くても構わないのか? 各指の使用率はどれくらいか? 左右の使用率は? かなの連なりを入力しやすくするには? それぞれの要素がどれくらいにするのか、どれくらい重視するのかを決めて、実際の配列作成ではその方針に従って作成していきます。
問題は、どのような要素を持った配列が使いやすいかどうか“使ってみる前に”わかるかどうか、ということです。
そこで、新下駄配列を作る前に、さまざまな配列を実際に使用してみました(※)。そして、どのような要素を持った配列が使いやすいのかを、自分で体験してきました。新下駄配列の方針は、各配列を使ってみて自分が使いやすいと感じた要素を採り入れるようにしました。
※ある程度使用したことのある配列:かな入力、ローマ字入力、NICOLA(親指シフト)、月配列2-263式、月配列U8版、下駄配列、飛鳥配列、けいならべ(v2も含む)、星配列、小梅配列。(「新下駄配列作成の歩み」)
方針を立てたら、それに従って配列を作ります。しかし、どのような配列にすればその方針に近づくのかが分からなければ、配列を組み立てていくことができません。
どのような配列にすれば方針に近づくことができるのか。それを決めるのがデータです。新下駄配列を作成するにあたっては、文章に対する十分なデータを先に収集しました。実際の配列作成では、データを見て作成しました。
そのデータは、自分が集めたデータが100万字データです(「新下駄配列の作成に使用したかな出現数・連なりデータ」)。さらに、それと合わせて小梅配列の作者である141Fさんが作られた10万字サンプルも見ました(「Weblog 61℃: 10万字サンプルにおける文字の出現頻度。」、「Weblog 61℃: 10万字サンプルにおける 2-gram 頻度。」)。
配列の使いやすさは、実際に文章などを入力するときに使いやすいかどうかで決まります。
しかし、実際に入力される文章は千差万別で、ある文章に対しては使いやすいが、ある文章に対しては使いにくい、ということが起こります。特定のジャンルで良く出る言葉や言い回しというものもあるので、ある時期に入力した文章に対しては使いやすかったが、入力する文章の傾向が変わったら使いにくくなった、ということも起こりえます。
実際に文章入力を繰り返して使いやすいとどうかを判断するという方法だと、その時々に入力する文章に影響され続けてしまいます。
あらかじめデータを集めておき、配列はそのデータに従って作成します。これにより、ある特定の文章に対しては完璧ではなくても、どのような文章に対してもある程度使いやすい配列を完成させることができます。
データは完璧ではありません。
データ自体が間違っている可能性があります。注意深くデータを収集しても、世の中に存在する文章に対してデータの量はわずかですので、データの内容に偏りがあることが考えられます。
また、データに表れにくい部分が、実は配列の使いやすさに重要な要素である、ということもあります。
データの不完全な部分を補正するものが、配列作成者のカンです。使ってみる前に、あるいは少し使ってみて、「これはいい」「これはダメだ」とカンで決めます。
先にも書いたように、わたしはこれまでさまざまな配列を実際に使用しきました。どのような配列が入力しやすいかのカンを育ててきたつもりです。
「方針を立てる」「データを見る」「カンで決める」という新下駄配列作成の原則を3つ挙げました。
この中で一番重要なのは「カンで決める」です。たとえ方針に逆らっても、データに表れていなくても、自分のカンを優先します。配列を作っていく上で「こうした方が使いやすい」と思えば、そうします。
■新下駄配列作成記 目次