ローマ字入力でもなく、かな入力でもなく

kouy.exblog.jp
ブログトップ

1万字のかなを入力する場合の打鍵数

 いくつかの配列について、キーごとの打鍵数を調べてみました。
 ここでは、「かなを1万字入力したら平均してそのキーを何回打鍵するか」という考え方で打鍵数を算出しました(そのかなの出現数×10000÷全体のかな出現数)。これならどれくらいそのキーを使うのかイメージしやすいし、サンプルを変えた場合でも比較できる。
 サンプルとなる文章は、ネット上やその他の文章を適当に集めた約100万字(※1)を、『Kanji2na』で漢字とカタカナをひらがなに直して、『morogram』で分析したものです。アルファベットや記号は〓に置き換えています(アルファベットや記号がいくつ連続しても〓は一つ)。
 分析結果の1-gram2-gramを置いておきます。

※1 その100万字データと、その作成方法:「100万字日本語かなn-gramデータ」

●ダウンロード:N-gram_1gram.txt
●ダウンロード:N-gram_2gram.txt

※わかりやすい『Kanji2na』の使い方:
『漢直ノート』「Kanji2na」
※わかりやすい『morogram』の使い方:
『漢直ノート』「morogramの使い方」
「N-gramモデルを利用したテキスト分析 ―実際にmorogramを使ってみよう―」


 「かな1万字」の数え方は、「濁点・半濁点は0文字」「小書きのかなは1文字」「句読点は1文字」「句読点以外の記号、数字、アルファベットなどは0文字」としました。

 調べた打鍵数を画像にしたんですが、このブログだと画像が見にくいので、下記のリンク先のページにもアップしました。たぶん、こちらのページの方が見やすいです。ついでに(結構主観的な)一言コメントもいれました。
■1万字のかなを入力する場合の打鍵数

●ローマ字入力
e0002687_22574996.gif

●けいならべ
e0002687_218327.gif

●JISかな入力
e0002687_2165353.gif

●新JISかな入力
e0002687_325996.gif

●月配列2-263式
e0002687_2172146.gif

●NICOLA
e0002687_217357.gif
●小梅配列1.3.0版
e0002687_2174834.gif

●下駄配列
e0002687_2162122.gif

 表の見方は、だいたい見た目で分かりますよね?
 表の右下の数値は、上がシフトを0打鍵と数えた場合の総打鍵数、下がシフトを1打鍵と数えた場合の総打鍵数です。ただし、ローマ字入力や月配列のように、シフトの打鍵のタイミングが文字キーの打鍵と変わらないものについては、シフトを1打鍵と数えた数値のみを出しています。
 キーの色は、200打鍵以上が黄、400打鍵以上がだいだい色、600打鍵以上が赤です。おおざっぱな分類ですし、600以上が全部赤なので、色だけじゃなくて数字も見て下さい

※表示されている数値は小数点以下の位を四捨五入した整数ですが、実態は小数点以下の位も保持しています。したがって、各キーなどに表示されている数を単純に足し合わせても、表の合計欄の数と同じにならない可能性があります。(2012/01/26追記)

 人によって使用するキーや指が異なりそうな部分は、以下の方法で数えました。

 ローマ字入力で使うキーについて。
・複数のローマ字つづりがあるものは、「ローマ字綴り対決」で、取り上げているものはその通りに。それ以外は打鍵数が少なくなるように入力。
・「っ」は次に子音(n以外)が来る場合はその子音で入力。その他は単独で入力。(ただし、「っ」の次に「っ」が来る場合は、最初の「っ」は単独で入力したと見なす)
・「ん」は次にあ行、な行、や行が来る場合は[N][N]で入力。それ以外は[N]で入力。

 外来音が小書きのかな後付け以外の方法でも入力できる配列では、「うぃ」「うぇ」「うぉ」「しぇ」「じぇ」「ちぇ」「てぃ」「でぃ」「ふぁ」「ふぃ」「ふぇ」「ふぉ」の12音はその方法で入力。その他は小書きのかな後付けで入力。

 左右のシフトどちらを使っても同じ文字を入力できる場合は、文字キーを押した手とは反対の手を使ってシフトを押す。

 最上段キーと右端キーの担当指について。
・左手:[1]は小指、[2]は薬指、[3]は中指、[4][5][6]は人さし指。
・右手:[7][8]は人さし指、[9]は中指、[0]は薬指、[-][P][;][/]とそれより右のキーは小指。



 今回の画像を作るために、『OpenOffice.org Calc』で作った表計算ファイルを置いておきます。今回画像を作った配列以外の配列のデータも入っています。
 一応、他のサンプルで調べたり、他の配列の打鍵数も調べることもできるように作りました。
e0002687_2257296.gif

 シートXの、H列がかなの出現数、I列が拗音調整したかなの出現数です。
 「拗音調整」というのは、ここでは、「きょ」の出現数を数える代わりに、「き」と「ょ」の出現数から「きょ」の出現数を引く、というような意味です。ローマ字入力や下駄配列のように、拗音の入力方法が小書きのかな後付け以外もある配列では、拗音調整した方の出現数を使います。
 B列とC列が、全体のかな数が1万字だった場合の各かなの出現数です。
 H列を入力すると、I列、B列、C列は表計算ソフトの方で計算されます。

 シートYは、拗音や、ローマ字入力の「っ」と「ん」での入力キーを数えるためのシートです。小書きのかなに対する各拗音の割合や、「っ」や「ん」の次に出現するかなの割合を計算します。(拗音調整後のかな数(シートXのI列)は、これを使って算出されます)
 これを入力するには2-gramのデータが必要です(「っc」は3-gramも必要)。データがない場合は、「最初から入力してある割合と同じ」ということにして、省略することもできるようになっています。(もちろん、正確さは減少します)

 そして、配列のシートの右側の方にある配列図を入力すると、各キーの打鍵数が算出されるようになっています。
 ……が、実際には調整しなければ部分がある場合が多いので、適宜入力して下さい。
 濁点や半濁点の担当キーは、そのキーのセルの計算式に「濁点」「半濁点」と入力すると濁点、半濁点の打鍵数が加算されます。(「名前の指定」([Ctrl]+[F3])を使用)

●ダウンロード:keycount.ods
by koutarou_13 | 2008-05-09 23:39 | ●その他の日本語入力配列の話

▼日本語入力方法はローマ字入力とかな入力だけではない▼ローマ字入力とかな入力以外も普通のPCで簡単に使える▼というわけで新下駄配列で快適PCライフをめざすkouyのブログ


by kouy