日本語入力システム
読み:にほんご-にゅうりょく-しすてむ
電子計算機
で、
日本語
の入力を行なうための機構のこと。様々な呼ばれ方をしてきたが、最近はこの呼び方に落ち着いているようだ。
目次
概要
特徴
種類
文節変換
形態素解析
辞書
補足
MS-DOS
Windows
iOS
主な製品
概観
MS-DOS/Windows
Mac OS 9まで
Mac OS X
UNIX/Linux
iOS
Android
概要
おおむね、環境ごとに次のように呼ばれる。
日本語入力FEP
(MS-DOS)
インプットメソッド
(Mac OS)
IME
(Windows)
特徴
種類
変換する単位ごとに、次のように分類される。
単漢字変換 ‐ 漢字1字ずつ変換する
単文節変換 ‐ 1文節ずつ変換する
連文節変換 ‐ 複数の文節からなる日本語を変換する
文節変換
初期の日本語変換システムは形態素解析を諦め、漢字を1文字ずつ辞書引きで変換する「単漢字変換」が普通だった。
やがて、より快適に入力できるよう「文節変換」や「連文節変換」などの一括変換の機能を備えるようになり、入力中の任意の文字編集なども出来るようになっていった。Windowsが登場し、日本語変換システムが「IME」と呼ばれるようになる頃は、連文節変換が半ば当然の時代となっていた。
連文節変換では日本語文の単語切り分けの精度が変換効率において重要な問題となり、速度重視で単純に頭から検索するだけのものから、切り分けた単語ごとに点数を与えてコスト計算を行なうもの、単語間の意味的な繋がりを辞書に搭載するものなどが現われた。
形態素解析
日本語の「かな」から「かな漢字混じり文」を作ることが、日本語入力システムの主たる機能である。
現在よく使われているのは連文節変換だが、日本語は
英語
などと違い単語間に空白を入れる「分かち書き」をしないため、仮名文字の羅列から単語の区切りを探し出し、それを単語変換する、という作業が必要になる。これは「形態素解析」と呼ばれている。
これは非常に難しい処理であり、この性能が変換効率に大きく関わってくる。
辞書
形態素解析の次に、一般には辞書と呼ばれる単語表を用いる。
解析された品詞と仮名から、適切な漢字を選ぶためには、その品詞+漢字の変換表が必要である。これが辞書と呼ばれている。
メーカーや作者も努力して単語表の強化を続けるが限度があるため、利用者が自由に登録可能となっているものが多い。
補足
MS-DOS
元々の由来となるMS-DOSは、そもそもこのようなシステムを想定していない。
しかし、キー入力を奪い取って処理することは容易にできたため、様々なシステムが開発され、様々な製品が販売された。
Windows
Windowsでは、MS-DOSの頃の反省もあり、IMEという形で日本語入力に対応した。
しかし技術的に難易度が高かったこともあり多くの企業が脱落、結局最後まで残ったMS-DOS時代からの企業は、ATOKのジャストシステムだけだった。
iOS
iOSは、
OS X
のカーネルを使った
スマートフォン
/タブレット用のOSである。
Mac OS Xはインプットメソッドとして様々なものを受け入れたが、iOSは標準以外を受け入れず、さらに、そういったソフトウェアを妨害するようなガードまで掛けるに至った。システムに対してインプットメソッドの実装ができない建て前なので、今後も他社製品が大々的に登場することはないと思われる。
さて、あらゆるOSに姿を現わすジャストシステムのATOKであったが、この環境は流石に苦戦。しかし、ATOKはiOSにはメモアプリとしてリリースされおり、アプリ内に限りATOKらしい変換ができ、コピペで他アプリと連携するという仕様。ジャストシステムの凄まじい執念が感じられる。
主な製品
概観
MS-DOSの時代には、様々なものが作られ販売されていた。
しかしそれらもWindowsには対応できず、Microsoft製品以外で最後まで残ったのはジャストシステムのATOKだけだった。
主な環境で使われる又は使われていた、主要なものは次の通り(ABC順)。
MS-DOS/Windows
ATOK
(ジャストシステム)
Baidu IME (旧称Baidu Type) (百度)
DFJ
(デービーソフト)
EGBRIDGE
(エルゴソフト)
Google 日本語入力
(Google)
Japanist (富士通)
Microsoft IME
(Microsoft)
OAK(オアシスかな漢字変換) (富士通)
skkime (Windows用SKK)
Social IME
VJE
(バックス)
WXシリーズ (A.I.SOFT)
WX
WXA
WXP
WX2+
WX3
WXGシリーズ (A.I.SOFT)
WXG
WXG2
WXG3
WXG4
松茸
(管理工学研究所)
Mac OS 9まで
Mac OSの場合、純正の「ことえり」以外の使用実績、開発実績は、よく分かっていない。
ATOK
AquaSKK (Mac OS用SKK)
ことえり
(Apple Computer)
Mac OS X
ことえり
(標準搭載のもの)
ATOK
AquaSKK
EGBRIDGE
(エルゴソフト) 廃盤
Google IME
MacUIM
Anthy
PRIME
SKK
Social IME
かわせみ
UNIX/Linux
UNIX系OSの場合、Windowsなどと違って、「かな漢字変換サーバー」と、そこにアクセスする「フロントエンド」に分割される例が多い。
Anthy系
変換システム(C/Sではなくパイプを採用)
Anthy
フロントエンド
anthy.el (付属品)
IM-JA
Kimera
SCIM
uim
たまご
(Tamago、egg)
ATOKシリーズ (ジャストシステム)
ATOK for Solaris
ATOK12 SE for Linux (Turbolinux用)
ATOK X3 for Linux (ATOK 2007相当)
Canna
(NEC)
サーバー
cannaserver
フロントエンド
canuum
kinput2
(kinput2-canna)
かんな/emacs (Mule用)
PRIME+suikyo系
サーバー
prime
フロントエンド
prime-el (付属品)
uim-prime
Sj3 (ソニー)
サーバー
sj3serv
フロントエンド
sj3
kinput2-sj3
SKK
サーバー
skkserv
フロントエンド
skkinput
VJE-Delta for Linux/BSD
サーバー
vjed
クライアント
vje
Wnn系
サーバー
Wnn
(
jserver
)
FreeWnn
Wnn4.2
Wnn6
Wnn7 (オムロンソフトウェア)
Wnn8 for Linux/BSD (オムロンソフトウェア)
フロントエンド
kinput2
(kinput2-wnn)
uum
wnmo
xwnmo
たまご
(Tamago、egg)
Mozc (
Google 日本語入力
のオープンソース版)
iOS
標準のもの (おそらく「ことえり」相当だが、特に名前はない)
ATOK
Android
フリーソフトを含めて様々なものがあるので、以下は一例。
ATOKシリーズ (ジャストシステム)
ATOK for Android
NX!input powered by ATOK (富士通、ATOKベース)
FSKAREN (富士ソフト)
Google 日本語入力
Simeji
Slime
POBox Touch (Xperia標準搭載)
Wnn系
FlickWnn
iWnn
OpenWnn
ArtIME 日本語入力
OpenWnn Plus
再検索