libkkc update week four

libkkc 0.1.8 と ibus-kkc 1.5.8 をそれぞれリリースしました。

今回の主な変更点は文節変換の改良です。これまでは、たとえば「行って来る」を「言って来る」に修正するためには、最初の2文字(「いっ」)だけを選択してから候補を選ぶ必要がありました。0.1.8 では、3文字以上(「いって」「いってく」など)を選択しても変換が可能です。

これは、これまで単にSKK辞書を「いt」で引いていたのを、文節を文として変換するようにしたためです(つまり一週目の記事 で「使っていない」と書いていた A* 探索を結局使うようにした)。

convert-segment

とはいえ、最初の文節区切りはまだ細かいままなので、活用などの情報を使ってもう少し自然に見せたいところではありますが…。

この他に ibus-kkc のメニュー項目をガイドライン(ドラフト)に沿うようにしたり、ショートカットで入力モードを変更する際にラジオボタンが複数選択されてしまう問題が修正されています。

menu

余談ですが、やはり NLP を勉強しておく必要があるかと思い、今年は Coursera の NLP コースを取ってみました。昨年は機械学習のコースを取ったのですが、本をつまみ読みするのに比べて、体系的に知識が得られるのと、トレンド(?)がなんとなく分かるのが良いですね。

13 Replies to “libkkc update week four”

  1. ibus-kkcをubuntu 12.10で使わせていただきました。
    (この文章もそれで書いています。)

    marisaの公式debパッケージがなかったので手動でインストールしたのですが、
    pythonバインディングは別口でインストールしないといけないことに全然気づかず、
    libkkc-dataのビルドで立ち往生しました。
    libkkc-dataのビルドがmozc以上に重いのも少し驚きました。

    libkkcの変換精度ですが、少し使った限りではanthyを置き換えても大丈夫な感じです。
    (近頃はmozcばかりを使っていてanthyの精度を忘れかけていますが。)

    気になった点をいくつか挙げますと、
    1. uenoさんもおっしゃっているように文節の区切りが短すぎるのは多少違和感がある。
    (「新し|い|変換エンジン」)
    2. ibus-kkcの注目文節が灰色バックに黒文字なのは少し見づらい。
    (ibus-mozcは水色バックに黒文字。)
    3. ibus-mozcで「omosiroi」と入力してスペースを押し、カーソルの↓を押すと確定してしまう。
    (ibus-mozcだと変換候補が表示される。)
    4. ibus-kkcのインプットメソッド名が「Kana Kanji」。
    どうもインパクトがないというか、ほかと区別がつきにくい気がする。

    ど素人がコメントを書くのは気が引けたのでが、
    まだあまりフィードバックがないようですし、
    Fedora 19で標準採用されるのなら私ぐらいの人も使うことになるのだろうと思い、
    書いてみました。
    新しい変換エンジンの登場にわくわくしています。

  2. ibus-kkcをubuntu 12.10で使わせていただきました。
    (この文章もそれで書いています。)

    marisaの公式debパッケージがなかったので手動でインストールしたのですが、
    pythonバインディングを別口でインストールしないといけないことに全然気づかず、
    libkkc-dataのビルドで立ち往生しました。
    libkkc-dataのビルドがmozc以上に重くて少し戸惑いました。:-]

    libkkcの変換精度ですが、少し使った限りではanthyを置き換えても大丈夫な感じです。
    (近頃はmozcばかりを使っていてanthyの精度を忘れかけていますが。)

    気になった点をいくつか挙げますと、
    1. uenoさんもおっしゃっているように文節の区切りが短すぎるのは多少違和感がある。
    (「新し|い|変換エンジン」)
    2. ibus-kkcの注目文節が灰色バックに黒文字なのは少し見づらい。
    (ibus-mozcは水色バックに黒文字。)
    3. ibus-mozcで「omosiroi」と入力してスペースを押し、カーソルの↓を押すと確定してしまう。
    (ibus-mozcだと変換候補が表示される。)
    4. ibus-kkcのインプットメソッド名が「Kana Kanji」。
    どうもインパクトがないというか、ほかと区別がつきにくい気がする。

    ど素人がコメントを書くのは気が引けたのでが、
    まだあまりフィードバックがないようですし、
    Fedora 19で標準採用されるのなら私ぐらいの人も使うことになるのだろうと思い、
    投稿させていただきました。
    新しい変換エンジンの登場にわくわくしています。

    1. (すみません、大量のスパムコメントに紛れて見落としていました。スパムフィルタを導入したので以降は大丈夫なはずです…。)

      フィードバックありがとうございます。2,3 については git で直しました。
      4 については若干意図的で、IBus が統合された GNOME 3 で、

      • 日本語 (かな) # キーボードレイアウト
      • 日本語 (かな漢字) # IBus IME

      のように並んで表示されると日本人には直感的かと思った次第です。
      翻訳が間に合わなければ “KKC” にしようかなあと考えています。

  3. お世話になります。

    libkkc-0.1.9 と ibus-kkc-1.5.9 を試しました。
    ibus-kkc-1.5.9 はビルドエラーが出るようです。
    > ibus-kkc-1.5.9/src/engine.c:694:
    > undefined reference to `ibus_property_set_symbol’
    > collect2: error: ld returned 1 exit status

    ibus-kkc-masterは問題ありませんでした。

    まず、2と3に対応していただきありがとうございました。
    (2に関してはモニタの輝度をかなり下げている都合で最初違いが分かりませんでした。:-)

    気づいた点をいくつか書きます。
    1. 候補の表示位置が文末なので、長めの文章を入力した時に視点が外れて見づらい
    「こんなふうににゅうりょくすると」と入力してスペースを2回押すと、
    「すると」の斜め下に候補一覧が表示される。

    2. F6, F7, F8, F9, F10の一発変換がない
    MS-IMEやibus-mozcだと、F6でひらがなに変換、F7で全角カタカナに変換、
    F8で半角に変換、F9で全角英数に変換、F10で半角英数に変換できます。

    3. 半角数字の優先度が低い
    「5かいめの」と入力して半角の5を出そうとすると、
    「five」や「#9」よりも低い10番目です。
    「1」を半角で出そうとすると、1枚目の候補ウィンドウにすら入っていません。
    (数字を半角で入力したい人は全てそれで揃えたがると思うので、
    ibus-mozcのように「数字は半角を優先する」みたいなオプションがあるといいと思います。)

    4. 変換の得手不得手が大きく、得意パターンから外れると基本語がなかなか出ない
    「すらはいっていません」を変換すると、「はい」で「入」が出るのは61番目。
    「みづらいです」でも「見」は「箕」や「巳」よりも下位。
    (1度学習させてしまえば済むことですが。)

    細かいことばかり書きましたが、
    新規のかな漢字変換エンジンとしては良い精度だと思います。
    リリースしてくださってありがとうございます。

    1. ありがとうございます。ビルドエラーは、おそらく IBus 1.5 で tarball を作ってしまったのが原因です。

      $ rm src/*vala.stamp

      などとして強制的に vala でコンパイルしなおせば直るかと思います。まだ 1.5 系は広く受け入れられていないようなので、次回からは 1.4 で tarball を作るようにします。

      1. については、候補を出すのは IBus のパネルの管轄なので(ibus-mozc は自前でウィンドウを出しています)、ちょっと難しいかもしれませんが、少し調べてみます。
      2. は便利そうですね。次のリリースまでに実装しようと思います。
      3. は数値変換のバグだと思います。オプションもあると良さそうですね。
      4. はコーパスに依存します…現在のところ wikipedia : Yahoo! 知恵袋 = 10 : 1 ぐらいのソースから作っているので、話し言葉には弱いかもしれません。

      取り急ぎ。フィードバックありがとうございます。とても助かります。

  4. 返信ありがとうございます。
    2については、たまにウェブの登録フォームで
    「全角で入力」などと指定されている時があるので、
    当てずっぽうにF8 F9あたりを押して、
    目的の表記のところでEnterを押しています。
    (ショートカットキーを全然覚えられない :-)

    ibus-kkcを起動して最初に思ったのは
    「アイコンがちょっと滲んで見えるな」ということでした。
    fedoraロゴの紺色の背景色とmplus-1c-regularのボールド表示で
    コントラストだけははっきりしたアイコンを作ってみました。
    http://www.geocities.jp/ep3797/snapshot/tmp/ibus-kkc-icon.png
    (直クリックで蹴られるようでしたらwgetで取ってみてください。)
    // 短時間で作った軽いネタなので気分転換程度にどうぞ。

  5. 最新エントリがコメント禁止(?ブラウザによるのかも)になっているので
    こちらに書きます。

    ibus-kkc-1.5.10 はビルドエラーが出ます。
    =============================
    /usr/bin/ld: ./.libs/libutil.a(libutil_la-user-rule.o):
    undefined reference to symbol ‘json_builder_get_root’
    /usr/bin/ld: note: ‘json_builder_get_root’ is defined in DSO
    /usr/lib/gcc/x86_64-linux-gnu/4.7/../../../x86_64-linux-gnu/libjson-glib-1.0.so
    so try adding it to the linker command line
    /usr/lib/gcc/x86_64-linux-gnu/4.7/../../../x86_64-linux-gnu/libjson-glib-1.0.so:
    could not read symbols: Invalid operation
    collect2: error: ld returned 1 exit status
    =============================

    それと細かいことですが、
    こちらではライセンスがGPLv3になっています。
    https://gitorious.org/libkkc
    COPYINGファイルではGPLv2です。

    ショートカットエディタの追加お疲れさまです。

    1. うーむ、それはおかしいですね…。COMMON_LIBS -> LIBKKC_LIBS -> “pkg-config kkc-1.0 –libs” 経由で、-ljson-glib-1.0 は指定されるはずなのですが…。
      お手数ですが、”make V=1″ の出力をどこかに貼ってもらえませんか?

      ライセンスに関して、libkkc は GPLv3 なのですが、ibus-kkc は ibus との兼ね合いで GPLv2 or later となっています。

      (コメント欄直しました。すみません)

      1. アップロードしました。
        http://www.geocities.jp/ep3797/snapshot/tmp/ibus-kkc-errors.txt

        ただ考えてみると、
        今はFedora以外の環境に配慮するよりも、
        機能の実装に集中するほうがいいと思います。
        ぱっと思いついたことはすでに書かせていただいたので焦っていませんし、
        debianなどのパッケージを作るかたはそれぞれに解決されると思います。
        (もう誰かがパッチを書いているかも。)
        そういうわけでお気になさらないでください。

Leave a Reply

Your email address will not be published. Required fields are marked *