AzooKeyKanakanjiConverter

0.8.0

Kana-Kanji Conversion Module written in Swift, supporting Neural Kana-Kanji Conversion and other cool features.
ensan-hcl/AzooKeyKanaKanjiConverter

What's New

v0.8.0

2024-05-19T12:37:56Z

What's New

  • ニューラルかな漢字変換システム「Zenzai」を導入しました。
  • CLIツールをアップデートしました
  • 学習に関する不具合を修正しました

Warning

#83 の影響で、v0.8.0系では一部の学習データが消失する可能性があります。多くの場合無害ですが、注意して更新してください。

What's Changed

  • [docs] minor version in README.md by @ensan-hcl in #82
  • [Fix] 学習の更新に関する不具合を修正 by @ensan-hcl in #83
  • [Change] 予測変換が重たいので、depthを小さくした by @ensan-hcl in #84
  • [Tools] 辞書データ解析用のサブコマンドをancoに追加 by @ensan-hcl in #85
  • [Fix] 学習データの更新ロジックを修正 by @ensan-hcl in #86
  • [cli] スコアを表示するオプションを追加 by @ensan-hcl in #87
  • [cli] 完全一致変換のみを出力するモードを追加 by @ensan-hcl in #88
  • [Feature] MetadataのAPIをより柔軟にし、任意のアプリ名を指定可能にした by @ensan-hcl in #89
  • [cli] 評価用コマンドを追加 by @ensan-hcl in #90
  • [cli] 複数の不具合を修正 by @ensan-hcl in #91
  • [Experimental] Zenzai by @ensan-hcl in #92
  • [Fix] Zenz.swift by @ensan-hcl in #94
  • [Fix] Zenzaiのtokenize処理において不必要に指定していたlowerを削除 by @ensan-hcl in #95
  • [Fix] 制約の適用を調整した by @ensan-hcl in #96
  • [Docs] Zenzaiに関するドキュメントを追加 by @ensan-hcl in #97
  • [Update] バージョンを更新 by @ensan-hcl in #98
  • [Docs] バージョン表記を変更 by @ensan-hcl in #99

Full Changelog: v0.7.0...v0.8.0

AzooKeyKanaKanjiConverter

AzooKeyKanaKanjiConverterはazooKeyのために開発したかな漢字変換エンジンです。数行のコードでかな漢字変換をiOS / macOS / visionOSのアプリケーションに組み込むことができます。

また、AzooKeyKanaKanjiConverterはニューラルかな漢字変換システム「Zenzai」を利用した高精度な変換もサポートしています。

動作環境

iOS 14以降, macOS 11以降, visionOS 1以降, Ubuntu 22.04以降で動作を確認しています。

AzooKeyKanaKanjiConverterの開発については開発ガイドをご覧ください。

KanaKanjiConverterModule

かな漢字変換を受け持つモジュールです。

セットアップ

  • Xcodeprojの場合、XcodeでAdd Packageしてください。

  • Swift Packageの場合、Package.swiftのPackageの引数にdependencies以下の記述を追加してください。

    dependencies: [
        .package(url: "https://github.com/ensan-hcl/AzooKeyKanaKanjiConverter", .upToNextMinor(from: "0.8.0"))
    ],

    また、ターゲットのdependenciesにも同様に追加してください。

    .target(
        name: "MyPackage",
        dependencies: [
            .product(name: "KanaKanjiConverterModuleWithDefaultDictionary", package: "AzooKeyKanaKanjiConverter")
        ],
    ),

Important

AzooKeyKanaKanjiConverterはバージョン1.0のリリースまで開発版として運用するため、マイナーバージョンの変更で破壊的変更を実施する可能性があります。バージョンを指定する際にはマイナーバージョンが上がらないよう、.upToNextMinor(from: "0.8.0")のように指定することを推奨します。

使い方

// デフォルト辞書つきの変換モジュールをインポート
import KanaKanjiConverterModuleWithDefaultDictionary

// 変換器を初期化する
let converter = KanaKanjiConverter()
// 入力を初期化する
var c = ComposingText()
// 変換したい文章を追加する
c.insertAtCursorPosition("あずーきーはしんじだいのきーぼーどあぷりです", inputStyle: .direct)
// 変換のためのオプションを指定して、変換を要求
let results = converter.requestCandidates(c, options: .withDefaultDictionary(...))
// 結果の一番目を表示
print(results.mainResults.first!.text)  // azooKeyは新時代のキーボードアプリです

options: .withDefaultDictionary(...)は、ConvertRequestOptionsを生成し、変換リクエストに必要な情報を指定します。詳しくはコード内のドキュメントコメントを参照してください。

ConvertRequestOptions

ConvertRequestOptionsは変換リクエストに必要な設定値です。例えば以下のように設定します。

let options = ConvertRequestOptions.withDefaultDictionary(
    // 日本語予測変換
    requireJapanesePrediction: true,
    // 英語予測変換 
    requireEnglishPrediction: false,
    // 入力言語 
    keyboardLanguage: .ja_JP,
    // 学習タイプ 
    learningType: .nothing, 
    // 学習データを保存するディレクトリのURL(書類フォルダを指定)
    memoryDirectoryURL: .documentsDirectory, 
    // ユーザ辞書データのあるディレクトリのURL(書類フォルダを指定)
    sharedContainerURL: .documentsDirectory, 
    // メタデータ
    metadata: .init(versionString: "You App Version X")
)

ComposingText

ComposingTextは入力管理を行いつつ変換をリクエストするためのAPIです。ローマ字入力などを適切にハンドルするために利用できます。詳しくはドキュメントを参照してください。

Zenzaiを使う

ニューラルかな漢字変換システム「Zenzai」を利用するには、ConvertRequestOptionszenzaiModeを指定します。詳しくはドキュメントを参照してください。

let options = ConvertRequestOptions.withDefaultDictionary(
    // ...
    zenzaiMode: .on(weight: url, inferenceLimit: 10)
    // ...
)

辞書データ

AzooKeyKanaKanjiConverterのデフォルト辞書としてazooKey_dictionary_storageがサブモジュールとして指定されています。過去のバージョンの辞書データはGoogle Driveからもダウンロードすることができます。

また、以下のフォーマットであれば自前で用意した辞書データを利用することもできます。カスタム辞書データのサポートは限定的なので、ソースコードを確認の上ご利用ください。

- Dictionary/
  - louds/
    - charId.chid
    - X.louds
    - X.loudschars2
    - X.loudstxt3
    - ...
  - p/
    - X.csv
  - cb/
    - 0.binary
    - 1.binary
    - ...
  - mm.binary

デフォルト以外の辞書データを利用する場合、ターゲットのdependenciesに以下を追加してください。

.target(
  name: "MyPackage",
  dependencies: [
      .product(name: "KanaKanjiConverterModule", package: "AzooKeyKanaKanjiConverter")
  ],
),

利用時に、辞書データのディレクトリを明示的に指定する必要があります。

// デフォルト辞書を含まない変換モジュールを指定
import KanaKanjiConverterModule

let options = ConvertRequestOptions(
    // 日本語予測変換
    requireJapanesePrediction: true,
    // 英語予測変換 
    requireEnglishPrediction: false,
    // 入力言語 
    keyboardLanguage: .ja_JP,
    // 学習タイプ 
    learningType: .nothing, 
    // ここが必要
    // 辞書データのURL(先ほど追加した辞書リソースを指定)
    dictionaryResourceURL: Bundle.main.bundleURL.appending(path: "Dictionary", directoryHint: .isDirectory),
    // 学習データを保存するディレクトリのURL(書類フォルダを指定)
    memoryDirectoryURL: .documentsDirectory, 
    // ユーザ辞書データのあるディレクトリのURL(書類フォルダを指定)
    sharedContainerURL: .documentsDirectory, 
    // メタデータ
    metadata: .init(versionString: "You App Version X")
)

dictionaryResourceURLのオプションはKanaKanjiConverterModuleWithDefaultDictionaryモジュールでも利用できますが、バンドルに含まれる辞書リソースが利用されないため、アプリケーションサイズが不必要に大きくなります。デフォルトでない辞書データを利用する場合はKanaKanjiConverterModuleを利用してください。

SwiftUtils

Swift一般に利用できるユーティリティのモジュールです。

Description

  • Swift Tools 5.9.0
View More Packages from this Author

Dependencies

Last updated: Mon Dec 09 2024 19:28:40 GMT-1000 (Hawaii-Aleutian Standard Time)