弐条海月の とはずがたり

そこはかとなく書き綴るブログなるもの

Macの「ことえり」辞書をDropboxで共有

複数のMacを使っている場合に困るのが日本語入力環境ではないでしょうか? 私はMacにおいては「ことえり派」なので、「ことえり」の辞書を強化(単語登録を最大限に活用)しつつ使っております。それを異なるMacでも反映させたい場合はどうすれば良いでしょうか。単に辞書ファイルをコピーするだけでは、その辞書が2つ存在してしまうことになるだけで、どちらか一方のMacで登録した単語は、他のMacでも同様に登録しなければならなくなります。使用するMacの数が増えれば増えるほど面倒なことになりますよね。今回はそれを実際に解決する方法。簡単に言えばオンラインストレージサービスの「Dropbox」を使って辞書ファイルを同期させることにしました。その方法を書いておきます。

「ことえり」辞書の共有・同期には「Dropbox」が必要ですので、アカウントを持っていない方は取得しましょう。「Dropbox」はフリーで2GBのスペースがもらえ、Windows、Mac、Linux、スマートフォンでファイルの共有が可能になります。またバックアップツールとしての機能もあり、リビジョン管理もできる優れもの。入れない理由が見つかりませんね。「Dropbox」の公式サイトはこちら。「Dropbox」について詳しく知りたい方は「Web担当者Forum」のこちらのページが親切です。

さて、ここからはDropboxのアカウントがある前提で話を進めます。まずは「ことえり」が参照する辞書ファイルのディレクトリについて。大元の場所はルート直下の「ライブラリ/Dictionaries」です。ここにはすでにデフォルトの辞書ファイル(ことえり用ではない)が入っておりますが、ここに追加で入れた「ことえり用の辞書は」どのユーザーでも使うことができます。これに対して、ユーザ(ホーム)のディレクトリ内にある「/ライブラリ/Dictionaries」は、そのユーザだけが使用することのできる辞書を入れます。すでに「ユーザ辞書」が存在している場合は、ことえりの単語登録を使用した証です。このユーザ辞書のファイルを先ほどのルート直下の「ライブラリ/Dictionaries」に入れると、誰もが使うことができるユーザ辞書になります。

ちなみに私の場合は、ユーザ(ホーム)のディレクトリ内にある「/ライブラリ/Dictionaries」の中に、カタカナを入力すると英単語に変換してくれる「NADのカタカナ英語辞書」と、私がよく使う言葉を登録している自作の「海月辞書」を入れております。まずはこのディレクトリのバックアップを取っておきます。続いて「Dictionaries」のフォルダを「Dropbox」のフォルダの中に移動します。私はMac用のファイルを格納するためのフォルダを用意しているので、Dropbox/For_Mac」の中に入れました。

続いてシンボリックリンクを作ります。これはエイリアス(ショートカット)みたいなもので、通常ならば「ことえり」が参照するフォルダ「Dictionaries」の場所をDropboxの中にあることを明示して参照させることができます。新しく単語が登録されたならば、それがDropbox内のファイルに書き込まれ、別のMacにも同期されます。これで異なるMacで使い慣れた辞書を安心して使うことができます。

シンボリックリンクはターミナルにて以下のコマンドを入力すると作成できます。

ln -s ~/Dropbox/For_Mac/Dictionaries /Users/ユーザ名/Library/Dictionaries

先ほど、ユーザ(ホーム)のディレクトリ内にある「/ライブラリ」のフォルダ「Dictionaries」を移動しましたが、ターミナルでのコマンド入力後は再びフォルダ「Dictionaries」が存在していることに気づくはずです。開いてみるとDropbox内に移動したはずの「Dictionaries」フォルダに相違ないと思いますが、これはシンボリックリンクによるものです。

同じノリで「ことえり」の自動学習辞書の同期もやろうと思えばできるのだろうけれど…どうしようか思案中です。ちなみにことえりの自動学習辞書の場所は「~/Library/Preference/com.apple.JapaneseAnalysis/」にあるファイル「LearningDictionary.dict」です。もし「ことえり」の変換結果がおかしいなぁと思ったら、このファイルを捨てると初期化されます(ユーザ辞書とは違いますから消しても大丈夫です)のでお試しを。


Ubuntu 10.04とModified Mozc

 Ubuntu10.10の時にダウンロードしておいたMozc関連の3ファイル「Modified Mozc」「Gui utilities of the Mozc input method」「Mozc engine for IBus -」を新たに入れなおしたUbuntu10.04に適用しようとしたら依存関係が満たせないとのこと。ちょっと考えて…Ubuntuのバージョンが違うからだなと気づき、10.04用のMozcを入手するため「憩いの場」というサイトからリポジトリを追加しました。

 追加したリポジトリを有効にするには、アップデートマネージャで再チェック、アップデートが必要です。それから「Ubuntu ソフトウェアセンター」にて「Modified Mozc」「Gui utilities of the Mozc input method」「Mozc engine for IBus -」を導入すればOK。

 Ubuntu 10.10では純正のリポジトリからMozcがインストールできるようになっておりますが、憩いの場さんのMozcは語彙が追加されているほか、アイコン関係も純正Mozcより洗練されているので好きです。

 豊富な語彙の例を挙げると…ボーカロイド01の「初音ミク」はもちろん、ボカロ03の「巡音ルカ」が一発で変換できるのはすごいことなんです。あっ、ちょっと例えが分かりにくいかもしれませんけれども(笑)。


「ことえり」と自作辞書で遊ぶ

この前作ったMacの日本語入力環境「ことえり」の自分辞書「海月辞書」がなかなか良い感じです。追加したテキストを見返すとアニメ、パソコン関連の語句が多いです。あと食べ物系ですかね(笑)。ずいぶんと片寄った辞書ではありますが、だがそれがいい(笑)。その良さは実際に使ってみないと分からないのですよ。とにかく、お正月は「ことえり」で遊ぶというのはいかがでしょう(笑)。今日はそんなお話ですよー。

例えば…上の画像を見てください。「ハートキャッチプリキュア」と「海月辞書」を入れていない状態で変換すると、このような文節で区切られます。「ことえり」は「ハートキャッチプリキュア」の熱心な視聴者ではないので知らないのは仕方のないことですけれども(笑)。

で、当然「海月辞書」を使うとこうなりますよ。

次はガンダムSEEDネタから。「アサルトシュラウド」という追加装甲がありましたが、「海月辞書」を入れていない状態で変換すると、


このように「あさる徒手ラウド」というとんでもない文節で区切られます(笑)。なんのことだかさっぱりですね。

まさに徒手空拳って感じ。こんなのを装備するとすぐにやられてしまいそうです(笑)。

もちろんですが「海月辞書」があれば大丈夫。ちゃんと下のように変換されますよ。

次は「ガンダムOO」から「アリオスガンダム」。「海月辞書」があればもちろん正しく変換されるのですが、ないと下のようになります。

ものすごく弱そうですね。アリを押すくらいのパワーしかなさそう(笑)。こんなガンダムならいらないですね(爆)。

次も「ガンダムOO」から「イノベイター」のはずが…手延べそうめんか洗濯板みたいな名前になってしまいましたね(笑)。間違いなく人類を超える存在ではなさそうな感じです(爆)。
最後は長文に挑戦。「ガンダムSEED DESTINY」からこんな言葉を変換してみましたよ。


それでは行きます。まずは「海月辞書」がない状態での変換結果です。

ご覧の通り、全く意味が通じませんね。まぁ当たり前ですけれども(笑)。

で、「海月辞書」適用後がこちら。
うん、満足の結果ですね。ただし、先に変な変換のままで確定してしまったため「ことえり」が学習してしまいまして…以後「あかいきたい」と入力すると予測変換機能のウインドウに「員フィニット…」とか、「ざふとのうたひ」で「歌姫ら楠…」が表示されているので困っております(笑)。

こんな風に日本語入力環境でいろいろ遊ぶと楽しいものですよ。皆さんもいかがですか(爆)。


自分専用のことえり辞書を作る

 今日は通常の仕事ではなくて大掃除でした。不思議なことに今年は大掃除を終えてもなお、年末ムードが盛り上がってきません、私の中で(笑)。そして明日はいつもより早く出社せねばならないので早めに寝るつもりですが、そんな私が今日行ったことはMac純正の日本語入力環境「ことえり」で使う自分専用の辞書、その名も「海月辞書」の作成です。

 自分専用辞書を作成するにあたり、どういった単語を学習させるのが一番効率的なのか考えてみます。ですが、その答えはすぐに出ることでしょう。なぜならば、自分が書く文章を構成する単語がストレスなく入力できることにほかならないからです。自分が使いやすい環境にするためには自分がよく使う単語を覚えさせるのが一番効率的な方法となるのです。

 自分専用辞書の作成には事前の準備が必要です。まずはこの日記の文章全てをWordPressのエクスポート機能で書き出します。すると容量6.33MBのXMLファイルがダウンロードされました。次にできたxmlファイルからタグを取ります。それをWindowsのATOKにあるAI辞書を鍛える機能を使ってユーザ辞書化する必要があります。

 続いて、出来上がったATOKのユーザ辞書をテキスト書き出しします。このテキストはタブ区切りになっております。そこからは「ことえり」が認識出来る形式にテキストを整形する作業が必要になります。

 最初にテキスト書き出しした状態ではこうなっております。空白部分はタブです。

よみ	読み	品詞

 「ことえり」が認識できるテキストファイルの中身は以下のような感じになります。

"よみ","読み","品詞"

 ですので、改行コードの「\r」を「”\r”で」置き換えてみます。これで行末に「”」が入り、次の行頭にも「”」が入ることになります。ただし、一番最初の行頭と最終行の行末には「”」が入らないのでここは手作業になります。

 次にタブコード「\t」を「”,”」で置き換えます。これでテキスト整形は終わりなのですが、品詞をいくつか変更する必要があります。「名詞サ変」を「サ変名詞」にするなどです。

 できあがったテキストの内容をざっと見て、いくつかおかしな単語を削除して2228行。これを「ことえり」読み込ませます。ダブりがあったのか登録できない言葉があったのかは分からないのですが、実際に登録してみると語数は1830になりました。

 これがことえりの性能にどんな影響を与えるのか…楽しみにしております。
もしかしておかしなことになったりして(笑)?


メイリオに見るフォントの美しさ

 今回追加したフォントはメイリオ。Windowsは好きではない私ですが、メイリオは別です。可読性に優れ柔らかな印象を与える美しいフォントだと思います。

メイリオはイギリス在住の日本人デザイナーの型が手掛けたフォントで、マイクロソフトのフォントとしては和文・欧文が混在する文章をモニター上で美しく表示できる初めてのフォントです。洒落ではないですが、ほんとうに良いフォントだと思います(笑)。

 先にも書きましたとおり、メイリオは和文と欧文が混在する文書での表示に最適化されている関係もあって、ベースラインなど欧文ならではの概念も取り入れて作られております。従って、マス目の中に文字を置く和文とは異なる概念を混在させるべく、行間がデフォルトで広く取られているのが特徴ですね。

 こうしたフォントはMac OS Xのヒラギノ書体にも見られるものです。文字が詰まったテキストエディタなどでは間延びした印象を与える可能性はありますが、その行間によって可読性がさらに高まっていると同時に、目に優しいレイアウトの一助にもなっております。実際にヒラギノ書体などを用いたレイアウトは得てして美しく組まれていることからもそれが分かります。

 最後は話が大きく逸れていきましたが、私は仕事の関係もあってタイポグラフィに興味があるので、iPhoneにタイポグラフィ系アプリをいくつか入れております。近く紹介してみたいと思います。


固定ページ

最近の投稿

カテゴリー





カレンダー

2024年3月
 123
45678910
11121314151617
18192021222324
25262728293031

過去の日記はこちら

キーワードで検索