親指Blog

キーボードによる文字入力関連(主に親指シフト)のBlogです。過去記事には色々入ってますが気にしないでください。

しまった。

 蜂蜜小梅を練習してるのに、Facebook親指シフトフォーラムで、OASYSを譲って貰うことになったぞ。

 どうしよう・・・。今更NICOLAに戻るか?

 

 それにしてもやはり普及していると言うのは強い。NICOLAならソフトもハードも先用品が簡単に手に入るのは魅力的だ。(それなりに高いけど)配列の移行に苦労していればなおさらである。

 こちらでは昔のNICOLAキーボードをカスタムし、今のPCで使えるようにしている。私もRboard for Macを持っていて、今問い合わせ中だ。復活できたらいいなあ。

hieroglyphe.blog47.fc2.com

 

 蜂蜜小梅のほうはかなり慣れてきているとは言え、まだまだ打鍵がおぼつかない。それでも時間が経つにつれて、頭の中に回路ができてきているようで、徐々に打鍵速度は速くなってきているのは実感できる。(たまにキレてローマ字でダカダカ打つときもあるけど…。)

 

 ……しかし、蜂蜜小梅ですら左人差し指の使用率が低いと感じるのはどうしてだろう。もっと人差し指は酷使してもいいと思うのだが。

 あと、「」と()については私には全く使えないことがわかった。ミスタッチの温床になっている。記号については使う人によって便利な配列が違うのだろう。標準化は必要なく、簡単に配列を変更できたほうが便利なようだ。

 

 ちなみに私のE列の配列は、

・右シフト:ゐ{}「」<>()〔〕〈〉

・左シフト:ゑ””/\/`’÷×+-*・

 となっている。

 

 右シフトには仕事で使う括弧を、左シフトには四則演算子を割り当てている。キーボードを見ればなんとなく思い出せる配列にしているが、これは自分が決めた配列だから覚えていられるのであって、他の人が使うとややこしいかもしれない。

 結局、自分が使いやすい配列は自分だけで使うのが一番かもしれないと考える今日この頃……。

 

 とはいえ、膨大なデータ解析をして基本の考えを作って頂いた先人たちには、足を向けて眠れないのだが。

うーん・・・(蜂蜜小梅雑感02)

 蜂蜜小梅にもだいぶ慣れてきて、そろそろ配列表を見なくても打てるようにはなってきた。とはいえ、まだまだNICOLAのようにすらすら打てる訳ではなく、頭がフル回転しながら打っているのが現実である。

  徐々に上達するにつれて、苦手なキーも明確になってきた。とにかく、ものすごくよく間違えるのが「き」と「く」だ。どうしても「き」を右手中指で打とうとしてしまう。なまじNICOLAとかなの位置が似ているのが災いしているのだろう。

  あと、「か」と「た」、「に」と「の」、「な」と「ま」、「ゆ」と「ほ」などを頻繁に間違う。「ゆ」と「ほ」は頻度がそれほど多くないのでいいんだが(よくない)、「かたにのなま」はかなりダメージが大きい。「かたな」など使用頻度TOP10に入るかなである。これを間違うのはどういうことなのだろう……。

 あと、思い出すのに時間がかかるかなもある。「て」「け」「こ」「と」「せ」「そ」はなぜか全然覚えられなくて、毎回考え込んでしまう。頭がフリーズを起こして自分でまどろっこしく思うぐらいだ。(「まどろっこしい」を打つのはとてもまどろっこしい……。)

 

 どこかで特訓が必要かも。

 

 

蜂蜜小梅雑感01

 得てして何事もとっかかりの時に不満点が出るもので、ご多聞に漏れず蜂蜜小梅配列にも色々と不満点が出ている。まあ大体は不慣れな事が要因ではあるのだが。

 何よりの不満は、やはりBSとESCキーだ。BSが右小指なのはしょうがないとしても、そこに同時打鍵でかなを置くのはどうだろう。ミスタッチすると前のかなが消えてしまうのは、結構なストレスになるような気がする。
 
 だが、それより問題なのはその隣のESCだ。あまり使わない記号キーだが、BSをミスタッチしたときのダメージが大きい。なんせ未確定のかなが全部消えてしまうのだ。これはNICOLAの時からそうなのだが、私はこれが大の苦手なのである。つい長文を未確定のままにして、タイプミスをしてBSを押そうとした瞬間に「あっ」となる。大ダメージである。

 まあこれは「やまぶきR」を使っているので、キー配列を変更すればいいだけだ。そこには「を」でも置くとしよう。
 
 ここまで打っても小指薬指は痛くならない。やはり設計は重要である。
 

蜂蜜小梅配列に移行

 NICOLAを練習しているとどうしても小指と薬指が痛くなるので、ここはと踏ん切りをつけて蜂蜜小梅配列に移行してみた。

homepage2.nifty.com


 さすがに久しぶりに配列を覚えるだけに、脳が全く追いついて来ない。それでもNICOLAが小指薬指を中心に指が回っているのに対し、中指人差指中心に回っているのが感じられる。

 とはいえ、不満がない訳ではない。特に母音の「あ」と「う」を同じキーにしたのはちょっと抵抗があった。NICOLAでは人差し指を連打することが少なかったのと、各指に母音を当て嵌めて覚えていたので、頭がなかなか覚えてくれない。ここらへんはローマ字入力を得意にしている弊害かもしれない。

 あと、思ったより人差し指が動かない。同時打鍵と混同されると見事に間違う。「野球」と書くと、「う」の前にぴたりと指が止まる。「やきゅ」までは同時打鍵なのに「う」だけは右手人差指単体なので、頭がつい親指を動かそうとしてしまうのだ。

 面白いことに意外とNICOLAとは混同しない。まあこれはもっと打鍵が早くなってくればまた違うのかもしれない。しばらくは脳内にキーボード表がちらつく日々が続きそうだ。

 

NICOLA随想その2

 昨日に引き続きNICOLAのかな配列について使用頻度上位30位ぐらいまでやろうかと思ったが、それより詳しい情報が月配列のページに既にあった。

他方式との比較 -中指前置シフト新JIS「月配列」

 

 このページの一番最後に、付録として主要な文章による各指の打鍵数へのリンクがあった。

  • キーボードによるカナ入力効率の比較 日本国憲法前文
  • キーボードによるカナ入力効率の比較 めくらぶどうと虹
  • キーボードによるカナ入力効率の比較 羅生門
  • キーボードによるカナ入力効率の比較 緋のエチュード

 一番私の文章の傾向に近いのは「緋のエチュード」のようなので、この打鍵数を引用すると、

NICOLA

 01020304050607080910111213合計
E段 0 0 0 75 77 0 0 0 0 0 0 0 0 152
D段 187 425 523 211 168 166 229 318 204 8 203 0   2642
C段 421 501 447 170 177 285 393 400 463 515 0 0   3772
B段 3 98 194 122 45 45 93 70 169 25 0     864
合計 611 1024 1164 1045 1211 788 836 751 7430

 

 こうなっているようだ。

 ホームポジション(青い部分)を見て各指の使用率を比較すると、やはり小指薬指の方が中指人差より打鍵数は多くなっている。前回のエントリーで書いたとおりになっていた。

 だが、やはりここまで根強い人気がある配列らしく、最下段の合計打鍵数ではちゃんと小指が最低になるように調整されていた。ホームポジションだけで判断してはいけないと言うことですな。(とは言え、左手人差指ホームや右手中指の負担率はもうちょっと上げられないものだろうかとは思うが。)

 

 ちなみにローマ字入力だとこうなっている。

ローマ字

 01020304050607080910111213合計
E段 0 0 0 0 0 0 0 0 0 0 54 0 0 54
D段 0 224 739 487 955 173 1041 1236 1350 27 0 75   6307
C段 1770 623 311 52 233 361 78 844 0 0 0 77   4349
B段 67 19 12 4 109 1012 324 203 182 8 0     1940
合計 1837 866 1062 1840 2989 2283 1532 241 12650

 

 

 NICOLAと比較すると、やはり右小指の打鍵数は圧倒的に少なく、左小指は圧倒的に多い。本来ならNOCOLAを使えば左小指薬指は圧倒的に楽になるはずなのに、なぜこんなにも両小指薬指が痛くなるのだろうか? ただ単なる慣れの性ではない気がするのだが…。

 

 あと、ローマ字入力の打鍵数を見ていると、右手のD段とC段をそっくり入れ替えたくなる。そして左手のAとF。ただそうすると左手人差し指の負担が凄まじくなるのと、Tの打鍵数が凄いのでこれももっと楽に打てるところに…とか考えていると、オリジナルの配列になって行くわけですな。つーか、そこまで変えるならSky配列とかM式とか使うべきですねハイ。

 

ひらがな頻度TOP10によるNICOLA随想

 

 各サイトのかな出現頻度データを適当に並べてみた。正確さなどはある程度無視。

 句読点は本来なら欲しい所だが、データによって上下がある上に、抜いてあるデータもあるので今回は除外。(だがかなり重要なキーだとは認識している。)

※段数は、スペースキーがあるのがA段~数字キーがE段と呼ぶ。ホームポジションがあるのはC段

 

f:id:hooligan:20151015153813p:plain

 TOP5は「いうんかし」で、これはどこでも大した変動は無し。

 1位はどのデータでも「い」。NICOLAではホームポジションの右手薬指で、押しやすいことは押しやすいのだが、なぜ薬指なのだろうか? ちなみに旧JISかなではD段目左中指、ローマ字入力ではD段目右中指に割り振られており、共にホームポジションではない。どれも押しやすいポジションではあるが、この微妙なズレ方が結構面白いと思う。(ローマ字での出現頻度を一緒にするなという話もあるが。)

 

 2位3位は「う、ん」。面白いのは、NICOLAだとこの二つが両小指に割り振られているところだ。ホームポジションとは言え、これだけ使用が激しいかなが小指の担当なのだ。その上句読点も小指担当。そりゃローマ字入力してる人がNICOLAを練習したら腱鞘炎にもなろうというものである。(そんな事実はありません。)

  

 4、5位も面白い。「か、し」だが、5位以内では「か」は唯一のD段キーだ。そして「か、し」は共に左薬指の割り当てである。なぜ薬指なのか。なぜ左なのか。興味は尽きない。

 

  そしてここまでを考えてみると、恐ろしいことにNICOLAでは出現頻度1~5位までのかなは、なんと小指と薬指にしか割り振られていないのである。まるで小指から順番に良く使うキーを割り振っているかのように。

 

 続けよう。6、7位は「と、の」。ここで初めて同時打鍵が出てくる。「と」は右人差指ホームで、「最も押しやすいキー」といえるだろう。ところが同程度出現する「の」は、ホームとはいえ同時打鍵となっている。 ~と、~の、という使われ方が多いのかもしれない。~は、~と、~の、で右手人差指、中指の担当でまとめられているのだろうか。

 

 8、9位は「た、て」だろうか。「た」は7位でもいいかもしれないが、ここでの1位程度の順位の上限はあまり関係しないのでよしとしよう。このふたつのかなは左中指のD段C段で使用頻度にほぼ合った配置といえるかもしれない。個人的にはもっと上位のかなを割り当てて欲しいと思ったりもするが、連続運指などの関連かもしれないのでここではひとまず置いておく。

 

 10位あたりには「な、つ、っ」が混在している。ここでもちょっと面白いのは、「な」は左中指同時打鍵で、同時打鍵キーの中で上位4番目という使いやすい配置なのだか、「つ」は右薬指D段、「っ」は右ホームだが小指同時打鍵と、使いにくい配置になっていると言えるだろう。使いやすい使いにくいが混在しているということは、利用するデータによって配列が左右される証明みたいなものではないだろうか。

 

 さて、NICOLAホームポジションのかなは「うしてけ(せは)ときいん」である。単純にデータと照合すると、「てけき」は10位以内に居ない。なんと最もよく動くであろう左中指人差し指、右手中指がTOP10のかなに割り振られていないのだ。

 

 しかし、NICOLAでは特徴として

 ・各指の負担を、大きい順に人差指・中指・薬指・小指とする。
・ホームポジョンの使用率を最も高く、次いで移動が容易な上段、最後に下段の順とする。
(出典: NICOLA配列キーボード 日本工業規格(JIS)化要望書

 と、ある。

 

 もちろんここまでの考察はただ単なるデータの一面しか見ていないのは承知している。運指であったり濁点、半濁点やn-gramの問題もあるだろう。しかし、ただ単純に打鍵数が多かったり受け持ちキーが多いというのは、根本的な問題となるのではないだろうか?

 

 その疑問は、まさに今熱を持っている私の両薬指小指が答えている気がする。

 

ひらがな出現頻度いろいろ

 最近何度も同じサイトを検索することが多いので、ここでまとめておく。

 

 ・ CNN・ABC・VOAの各ニュースの各分野からランダムに4万1600文字を抜き出して各文字についてカウント
Dvorakjp 文字頻度表

 ・10万字サンプル(種類色々)における文字の出現頻度。(10万字サンプルについて
Weblog 61℃: 10万字サンプルにおける文字の出現頻度。

・約一年分の日記やメモから75万字
 漢直ノート ひらがな1-gram表

 ・日記抽出による全244万文字
自分のBlogにおける「ひらがなの出現頻度」を、パソコンを使って調べてみよう!(kanji2na+morogram編、244万文字頻度付き) - 雑記/えもじならべあそび

はてなダイアリー日記内かな連接頻度データ452万文字分
452万文字分の、はてなダイアリー日記内かな連接頻度データ。- 雑記/えもじならべあそび

 ・青空文庫からですます調主体600万字+丁寧なビジネス文書・手紙100万字程で計700万字(2015/10/16追記)
飛鳥カナ配列 ☆未来の子供たちへの贈り物☆(ソースは2ch)

・  月見草は口語体ベースで1795万字の文章サンプルを元に計算されているよう。 (2015/10/16追記)
月見草開発に用いた文章サンプル -最適化計算によるかな配列『月見草』

雑記/えもじならべあそびさんの所にギガクラスの大規模N-gramデータの情報があった。(2015/10/14追記)
大規模N-gramデータが公開されていた……改正著作権法の施行後に公開されたものらしく、作者提示の利用条件で安心して使えるところも◎

 

 対して、NICOLA国立国語研究所「電子計算機による新聞の語彙調査」(秀英出 版)から抽出した熟語漢字3271語と、雑誌「言語生活」(築摩書房)収載の 「録音機」より話し言葉約1万5000語(合計約1万8000語)を抽出して配列の参考にしたとのこと。(2015/10/15追記)
NICOLA配列キーボード 日本工業規格(JIS)化要望書 -日本語コンソーシアム

  また、分析データは無いが、TRONはビジネスマン向けの単行本、ビジネスレター、コンピュータのマニュアルを解析して160万文字サンプル取ったようだ。
BTRONにおける入力方式 -TRONキーボードの設計-

 

 しかし、ここまでサンプル文字数が必要ということは、文字使用の傾向は結局「人に寄る」ということだろう。
 いろんなところでも言われているが、上位10~15位当たりまでで全かなの50%以上が入力可能のようだ。ならば、後は「人に寄る」訳で、あまり真剣に考える必要はないんじゃないかと言うのは暴論だろうか?

 

あと覚え書きで、

日本語処理研究工房 ことばの森

特定非営利活動法人 言語資源協会(GSK)

データは豊富にあるようですなあ。

しかしホントこの頃の前人の方々の努力には頭が下がります。