広告掲載

音で引くタイ語辞書の作り方(2)

音で引くタイ日実用辞典をPCで作ってみよう!

前回は岡滋訓氏の「音で引くタイ日実用辞典」の有用性を説明しました。
今回はいよいよPC版「音で引く日タイ日実用辞典」の作成のお話です。

前回、日本初だとか大げさなことを書いてちょっと誇大宣伝をしてしまいましたが、辞書ソフトを作るといっても、 私が実際にタイ語辞書ソフトを作成して何万語もタイ語を登録するわけにもいかないので、既存のタイ語辞書ソフトを流用します。

こちらのページで説明した「PDICタイ語」です。
残念ながら白石昇氏の辞書ファイルには発音記号が登録されていないので、変換が大変です。
音で引くタイ語辞典を作るのに、最も簡単な方法は、すでに存在する発音記号をルールに則って、変換してやるのが一番だからです。

従ってここではオリジナルのPDICタイ語に登録されている辞書ファイルを変換してやることにします。
タイリンが作成したのは、その為の変換ツールというわけです。

ところで、どうでも良いことですが、このツールの名前を付けます。今考えました。
「音で引くタイ日実用辞典作成ツール」だとか、「音で引くタイ語辞書変換ソフト」だとか、覚えにくいのでツールの名前はこんな感じにします。

  • 音リンガルコンバーター

さて、名前が決まったところで、早速このページからダウンロードしてください。

残念なことに、手元にあったVisual Studio2008で手軽に作ってしまったので、音リンガルコンバーターを動かすには「.netframework」のインストールが必要になっていると思います。

「.netframework」はこの辺からダウンロードしてください。
「Microsoft .NET Framework 3.5 再頒布可能パッケージ」 で良いと思います。

作成手順

音リンガルコンバーターが起動できる準備が整ったところで、全体の辞書作成手順を説明します。

(*注)この記事を書いた後にPDIC Unicode正式版がリリースされました。 しかし、正式版では現状うまくCSVコンバート出来ない様なので、以下の処理は旧版PDIC/Unicode Ver0.70でお試しください。

  1. PDICを立ち上げる
  2. PDICの辞書変換機能を使って、PDIC形式(.dic)の辞書ファイルをCSV形式(.csv)の辞書ファイルとして出力する
  3. 音リンガルコンバーターを起動し、2で出力したCSV形式の辞書ファイルを指定し、変換処理を施す。→音で引く為の辞書ファイルがCSV形式で出力される
  4. PDICの辞書変換機能を使って、2とは逆に3で作成したCSV形式(.csv)の辞書ファイルをPDIC形式(.dic)の辞書ファイルに変換してやる。
  5. 4で変換されたPDIC形式(.dic)の辞書ファイルをPDICの辞書グループに登録する

こんな感じで処理していきます。
なぜ、 PDIC形式(.dic)の辞書ファイルをそのまま音リンガルコンバーターで処理しないかというと、CSV形式(.csv)の方が処理が簡単だからです。ちょっと面倒かもしれませんが、ガマンして下さい。

以下、手順の1~5を順に説明していきます。
尚、PDICがまだ入ってない方は、こちらのページを参考にしてPDICをインストールしておいてください。

1.PDICを立ち上げる

  →立ち上げてください。

2. PDICの辞書変換機能を使って、PDIC形式(.dic)の辞書ファイルをCSV形式(.csv)の辞書ファイルとして出力する

「Tools」->「辞書の変換」を選びます。

転送元辞書のファイル形式を「PDIC形式」、転送先辞書のファイル形式を「CSV形式」にしてください。
そして、転送元辞書の「参照ボタン」をクリックします。

PDICタイ語からダウンロードしてきた、辞書ファイルを選択してください。
通常は「C:\Program Files\Personal Dictionary (Unicode)」フォルダあたりに入っているはずです。
また、PDICタイ語の辞書ファイルには、無料版と有料版があります。
下の写真は有料版の辞書ファイル(Uni-PdicThai-039b.dic)です。
ファイルを選択して「開く」をクリックします。

同様に、転送先辞書ファイルも、「参照」ボタンをクリックしてファイルを指定します。
こちらは既存のファイルでなく、「ファイル名」欄に新規にファイル名を入れます。
名前は何でもよいのですが、ここでは仮に「oto.csv」としました。
「開く」ボタンをクリックします。

これで、CSV形式で辞書ファイルの出力準備が整ったので、「辞書の変換」画面で「OK」をクリックします。
下の画面の様に、変換中画面が出ます。

変換が完了します。
私の使っているPDICタイ語(有料版)には、4万7千件くらいの用語が登録されていたようです。

続いて、

3.音リンガルコンバーターを起動し、2で出力したCSV形式の辞書ファイルを指定し、変換処理を施す。→音で引く為の辞書ファイルがCSV形式で出力される

を説明します。

音リンガルコンバーターを起動してください。
シンプルな画面です。
「変換元辞書ファイルを選択」ボタンをクリックします。

ファイル選択画面が立ち上がります。
2.で作成したCSV形式の辞書ファイルを選択します。
(ここでは、「oto.csv」)
「開く」ボタンをクリックします。

続いて「変換後出力辞書ファイルを選択」ボタンをクリックします。
下のような画面が立ち上がります。
ここでは、既存ファイルではなく、新規で作成するファイル名を「ファイル名」欄に入力します。
ファイル名は何でも良いのですが、ここでは仮に「oto_out.csv」とします。

変換準備が整ったので「変換」ボタンをクリックします。
この変換処理は大変時間がかかります。
私のPCではCPUが100%になった状態で1分以上かかりました。
CPUが100%にならない人はメモリーが足りていない可能性があります。
メモリーが足りないと仮想メモリーを使用することになるため、大変時間がかかります。
「変換」前に、他のプログラムを閉じておくことをお勧めします。

変換中の画面です。
変換中の単語数が表示されます。
時々固まったように見えるかもしれませんが、実際には動いています。

処理が完了します。

これで、音リンガルコンバーターの役目は終わりました。

続いて

4.PDICの辞書変換機能を使って、2とは逆に3で作成したCSV形式(.csv)の辞書ファイルをPDIC形式(.dic)の辞書ファイルに変換してやる。

を説明します。

2.と同様にPDICを立ち上げて
「Tools」->「辞書の変換」
を選択してください。

今度は2と逆に

 ・転送元辞書に「CSV形式」
・転送先辞書に「PDIC形式」

を選択してください。
その上で転送元辞書の「参照」ボタンをクリックします。

ファイル選択画面が立ち上がるので
3.で作成したCSV形式の辞書ファイル(ここでは「oto_out.csv」)を選択して「開く」をクリックします。

続いて辞書の変換画面で転送先辞書の「参照」ボタンをクリックします。
ここでは、既存ファイル名ではなく、「ファイル名」欄に新規のファイル名を入力します。
ここでは仮に「Uni-PdicThai-039b-oto.dic」としました。
「開く」ボタンをクリックします。

これで、変換準備が整いました。
辞書の変換画面で「OK」ボタンをクリックします。
処理を続けていくと下のような画面が出てくると思います。
「以降自動処理」をクリックします。

処理が完了しました。
約14万件が登録されました。
元が4万7千件だったので、3倍に単語数が増えたことになります。

これで、PDIC形式の辞書ファイルが作成されました。

続いて

5.4で変換されたPDIC形式(.dic)の辞書ファイルをPDICの辞書グループに登録する

を説明します。


「File」->「辞書グループ編集」を選択します。

現在登録されている辞書ファイル一覧が表示されます。
ここに先ほど作成した辞書ファイルを追加してやります。
画面下の方にある「辞書追加」ボタンをクリックします。

4で作成したPDIC形式(.dic)の辞書ファイルを選択します。
(ここではUni-PdicThai-039b-oto.dic)
「開く」ボタンをクリック

使用辞書の中に今追加した辞書ファイルが入っていることを確認できます。
「OK」ボタンをクリックして完了です。
作成したCSVファイル(ここでは「oto.csv」「oto_out.csv」)は不要なので削除してかまいません。

試しにちょっと使ってみましょう。
水浴びをする「アープナーム」を検索します。

  • apnam

と入れてみてください。
下のようにヒットすれば成功です。(anamでもヒットします)

「音で引くタイ語辞書」のルールについて

・・・書こうかと思いましたが、疲れたので、ブログの説明を参照してください。
実際の使用画面で具体例を挙げているのでわかると思います。


コメント

初めてコメントします。
質問ですが、音で引くタイ語辞書の作り方(2)
音で引くタイ日実用辞典をPCで作ってみよう!
ですが
以下、手順の1~5を順に説明していきます。
尚、PDICがまだ入ってない方は、こちらのページを参考にしてPDICをインストールしておいてください。の
1.のPDICタイ語(Unicode版)ですがダウンロード&設定方法は氏のサイトに詳しく載っているのでその通りに実行してください。
のダウンロード&設定方法が解りません。
PDICタイ語のWebサイト欄からクリックすると
GYAO BBベーシックのHPに、なります。
申し訳ありませんが、
PDICのダウンロードとインストール手順を詳しく教えて貰いませんでしょうか?
お願いばかりですみません。
宜しくお願いします。



| kawa | 2009-01-18 12:02:33 |

kawaさん
ご連絡ありがとうございます。
PDICタイ語のサイトは引っ越しされていたようですね。
新しいURLは
http://www.pdicthai.com/~pdicthai/
こっちになるようです。
後で、サイトのURLも直しておきます。

上記URLを読んで頂ければダウンロード&設定方法が詳しく載っているのでわかるかと思います。

| タイリン | 2009-01-18 13:54:57 |

初めまして。タイに来て4カ月、言葉でも文化
でも非常に苦労しています。そんな中当サイト
すごく役に立ってます。
ところで、質問です。「音で轢くタイ語辞書」
ですが、PDICのバージョンアップにより手順
が変わってるのはいいとして、「音リンガル」
による変換ができません。といいますか、変換
後のCVSファイルが壊れちゃうようです。
具体的には変換後
「0,\"ก\",\"■ก\",0,0,0,\"0\"」
って感じです。

PDICは
Unicode Ver.5.2.6
辞書ファイルは
Free旧ユニコード版見出し数 10,064
無料バージョン
です。

タダのじゃダメですか?


| #57 | 2009-06-04 20:45:19 |

こんにちは。

これは既知の問題で私も解決できません。
ブログにも書きましたが↓
http://www.tlin.jp/blog/2009/05/pdicunicode.html
どうも、新バージョンのPDICの変換がちょっとおかしい様です(推測ですが)。

私は、旧バージョンのPDICを使って変換しました。
http://homepage3.nifty.com/TaN/pdic-unicode.html

無料でもモチロン大丈夫ですよ。


| タイリン | 2009-06-04 23:02:05 |

素早いご回答ありがとございます。ならびに、
ブログ全部読んでませんでした。ごめんなさい。

さて、ごめんなさいついでに助けてください。
教えて頂いた通り、旧バージョン(Ver.0.70)
をダウンロードして再トライしてみたのですが、
「辞書の変換」時に以下のエラーが出てCSV形式に
変換できないんです。

①旧バージョンの辞書(Uni-PdicThai-Extra-042.dic)
を変換しようとした時
「辞書(またはファイル)がオープン出来ません」

②新バージョンに変換した辞書(Uni-PdicThai-Extra-042U.dic)
を変換しようとした時
「PDIC用の辞書ではありません」

私、パソコンあんまり得意じゃないんです。
私のパソコンのせいでしょうか?それとも、
やっぱりタダのじゃダメなの?


| #57 | 2009-06-06 16:03:59 |

えーと、いろいろ試していたので、具体的な手順を忘れてしまったのですが、確か

①新バージョンのPDICで辞書ファイルをCSV出力
②ツールで音で引く辞書に変換(CSV->CSV)
③旧バージョンのPDICでCSV取り込み(PDIC形式の辞書に変換)
④新バージョンのPDICで③で作ったPDIC辞書ファイルを取り込み

だったと思います。

| タイリン | 2009-06-07 18:52:44 |

えー、何度も申し訳ありません。私の質問の仕方が悪かったようです。
お聞きしたいのは、上記ご回答②の部分で、コンバータによる変換が
うまくいかない点です。

具体的には変換前のCSVではコーカイの行は
「ก,\"ก\",\"【タイ文字】鶏のk(中子音・順位1),[にわとりのk]\",\"koo kai [k as a final]\",0,0,0,\"k%%-k<i\"」
のようになっています。
これを私のパソコンで「音リンガル」を使って変換しますと、
「0,\"ก\",\"■ก\",0,0,0,\"0\"」(「กงการ」以下同様)
のようになってしまうのです。

要領得なくてすみません。子供に教えるつもりで気長にお願いします。

| #57 | 2009-06-08 11:10:11 |

えーと、今試しにフリー版でやってみましたが、何の問題もありませんでした。
というより、知りませんでしたが、フリー版はそもそも旧PDIC版にしか対応してないのですね。(バージョンアップされてない。)

なので、新PDICはまったく関係ありません。
このページに書かれている手順でそのまま問題ないはずです。

ちなみに、変換前のコーカイの行は

\"ก\",\"【タイ文字】鶏のk(中子音・順位1),[にわとりのk]\",\"koo kai [k as a final]\",0,0,0,\"k%%-k<i\"

です。なんか、ちょっと違いますね。
その辺が原因ではないでしょうか。

なぜ#57さんが出力したCSVがそうなってしまうのかわかりませんが、フリー版の場合は新PDICは関係ない様です。

| タイリン | 2009-06-08 14:45:30 |

いやー、ありがとうございました!できました!!
最初のCSVへの変換を旧バージョンのPDICでやらないと
ファイルの中身が微妙に違っちゃうみたいです。

おかげさまで、これで今までの100倍仕事ができそうです。
お手数おかけしました。



| #57 | 2009-06-08 17:00:07 |

良かったですね。
タイに来て4ヶ月だと私はタイ語学校に通っていました。
よく耳にするんだけど意味がわからない単語が山のようにありました。そんなときに音で引く辞書にはお世話になりました。


| タイリン | 2009-06-10 01:50:41 |

タイリンさん、初めまして!
「音で引く日タイ日実用辞典」愛用者ですが、PCで使えるなんて大感激です。
先ほど完成し喜びに浸っています。
もっと早くタイリンさんのサイトを知っていたらと悔しい気持ちもありますが、喜びの方が大きいです。
お気に入りに登録させてもらったのでこれからも遊びに来させてください。
そしてこんな素敵なサイトをありがとうございます。

| anko | 2009-09-07 12:26:08 |

「音で引く日タイ日実用辞典をこよなく愛用する会」会員No1のタイリンです。

日常でも仕事でも大活躍。今ではこの辞書がない生活は考えれないほど使い倒しています。

本当にこんな便利な辞書は他にないですよね。
(このツールのことではなく、「音で引く辞書」のことです)

iPod Touchを購入したので、ここにインストールして移動中も辞書が引けるようにしようと画策している今日この頃です。


| タイリン | 2009-09-07 21:25:54 |

「音で引く日タイ実用辞典をこよなく愛用する会」幽霊会員のankoです。

本当に便利でこれから手放せなくなりそうです。
私はタイに来てもうすぐ3年です。
仕事でも語学留学でもなくなかなか上達しませんが、恵まれた環境のなかマイペースで続けています。
iPod Touchでも使えるようになるなんて、考えただけでわくわくしますね。
楽しみにしています。


さてその後「日タイ辞書を作る」で幸せな気持ちが吹っ飛んでしまいました…。。
何度やってもエラーコメント「×××.dicは使用中のため利用できません」がでます。
アプリケーション全部終了してやったり、設定を見直したり、Q&A検索もしましたがお手上げ。

タイリンさんの図と若干違うのは、使ってるPDICのバージョンが古いせいと思い最新版をDLしたけど、また同じエラーメッセージ。
結局原因がわかりません。
もし何かヒントがありましたら、いつでも結構ですのでお教えください。
お手数おかけしますがよろしくお願いします。


| anko | 2009-09-08 00:11:49 |

「PDIC Unicode版を昔から使い続けている時代遅れ会員」のタイリンです。

まず、ダウンロードされたPDICタイ語は最新版ですか?
実は「日タイ辞書を作る」の説明はちょっと古くて、最新版のPDICタイ語は最初から「日タイ辞書」が付属しています。
従って、PDICの機能を使って「日タイ辞書」を作る必要はありません。

「PDICタイ語 逆引き正式版」と呼ばれている辞書です。

ただし、無料会員版にはこの辞書ファイルがついていないので、やはり自分で作る必要があるみたいですね。
ankoさんのPDICは有料版ですか?

あと、もしかしたら、なのですが出力先の「×××.dic」が読取専用になっていたりしませんか?
私の時は、なぜか読取専用になっていてファイルが作れなかった経験があります。
ファイルを右クリックで「プロパティ」を開いて、「読取専用」をはずしてやったらうまくいったことがあります。


| タイリン | 2009-09-08 02:15:26 |

私のPDICは無料会員版です。
タイリンさんご指摘の「読取専用」もチェックしましたが結果は同じ。。
うーん、前より格段便利にはなったけど悩ましいところです。
有料会員になったほうがいいかなぁ…。。


| anko | 2009-09-08 16:03:59 |

こんばんは。
最新版でないバージョンをDLして触っていたらできるようになりました。
タイリンさんの図と同じ表示になったので、ちょっと予兆はありましたが嬉しいです。
私のバージョンが古すぎたせいかもしれませんね。

今夜はさらに便利になった辞書を使ってタイ語の復習します~!
ありがとうございました。

| anko | 2009-09-08 20:14:32 |

バージョンによって色々あるんですね。

次はぜひ携帯電話(スマートフォン)にもインストールして自宅用・外出用と使い分けてみてください。

私は仕事で使うタイ語を勉強中です。

「チャッジェーン」「クワップクム」「ラーイライアット」「ポンガトップ」「ワットゥパソン」「・・・」

まったく日常生活で使わない単語ばかり使うので頭が痛いです・・。


| タイリン | 2009-09-09 21:53:40 |

はっきりしませんが、きっとバージョンのせいでしょうね。。

スマートフォンにインストールできるとのことですが、自分の携帯がそれに該当するかさえわかりません。
ちょっと研究してみます~。

タイリンさんがお仕事で使う単語、どれもわかりません。

| anko | 2009-09-10 20:26:38 |

タイリンさん、こんにちは。今度はこちらにもお邪魔しました。PDIC(タイ語)はインストールしてありましたので、早速音リンにも挑戦してみましたが、まだうまく行きません。ankoさんが書かれているように旧バージョンでの変換が必要なんでしょうかね。私のは有料版5.3.4なんですが。
CSVファイルを見ましたら「\\\"」の部分が「\"」になっていたので、全置換で訂正してから変換しましたが、「apnam」の入力では同じような画面になりませんでした。ちなみに辞書ファイルはUni-PdicThai-049U.dicです。またトライしてみて報告します。よろしくお願いします。

| Ocean | 2009-10-27 14:38:19 |

すみません、入力ミスがありました。

CSVファイルを見ましたら「\\\"」の部分が「\"」になっていた
の間違いです。ごめんなさい。

| Ocean | 2009-10-27 14:41:17 |

どうも¥¥と¥が勝手についてしまうようです。前の方が円マークとダブルクォーテーションで後の方は円マークなしです。お目汚しでごめんなさい。

| Ocean | 2009-10-27 14:44:45 |

よくわかりませんが、私が試したときは新バージョンのPDIC(Unicode正式版)ではうまくいきませんでした。

ですので、「PDIC/Unicode旧版 Ver0.70」を使って変換してみてもらえますか?

| タイリン | 2009-10-27 18:27:33 |

タイリンさん、またまた連続の書き込みになってしまってすみません。
ただ今、取り込みに成功しました。
タイリンさんの
| タイリン | 2009-06-07 18:52:44 |のコメントに忠実に従ってしましたところ、見事apnam で「入浴する」が出ました。とてもうれしいです。最後の4.で辞書が古いので新しい形式に変換しますと言われました。
ついでに、私のipod touchに入れてあるEBPocket(有料)にも入れてみましたところ見事に動作してくれました。これで一気に肩の荷がおりましたので、またコツコツと勉強を続けたいと思います。本当に有難うございました。

| Ocean | 2009-10-27 18:39:31 |

良かったですね。
私もiPod Touchユーザーなんですが、EBPocketはどうですか?
600円もするので(←ケチ)、ちょっと考えているところです。
他の辞書ソフトで100円くらいのもあったはずなので・・・。


| タイリン | 2009-10-27 21:19:41 |

どうやったらTouchで使えるか、の興味で入れた位なので余り利用していないです。昨日は指さし会話(タイ)も入れましたが(700円もしました!(^^)! )今週末のツアーでは不要でしょうね。
いずれ、先に役立てば良いのですが。


| Ocean | 2009-10-27 21:55:51 |

じゃあやっぱりEBPocketはしばらく保留にしておきます。
予想外に使い勝手がよかったらまた教えてくださいね。
というか、今週末にタイへ旅行に来られると?
楽しみですね。

| タイリン | 2009-10-28 02:13:25 |

コメントを書く:
名前:
email:
コメント:


タイを旅行するなら?(PR)

バンコク

プーケット

チェンマイ

サムイ島


チャーン島


パタヤ

タイの観光地をタイ語で
アユタヤ:อยุธยา
王宮:พระบรมมหาราชวัง
王宮前広場:สนามหลวง
カオサン通り:ถนนข้าวสาร
カオヤイ国立公園:เขาใหญ่
カンチャナブリ:กาญจนบุรี
クラビ:กระบี่
国立博物館:พิพิธภัณฑสถานแท่งชาติ
サファリワールド:ซาฟารีเวิลด์
サムイ島:เกาะสมุย
サメット島:เกาะเสม็ด
サヤーム:スクエアー:สยามสแควร์
サンペーンレーン:ซอยสำเพ็ง
ジム・トンプソンの家:บ้านจิมทอมสัน
スアン・サヤーム:สวนสยาม
スクンビット:สุขุมวิท
スコータイ:สุโขทัย
スネーク・ファーム:สวนงู
スワンナプーム国際空港:สนามบินสุวรรณภูมิ
タニヤ:ธนิยะ
ダムヌン・サドゥアク水上マーケット:ตลาดน้ำดำเนินสะดวก
チャーン島:เกาะช้าง
チャトゥチャック市場:ตลาดนัดจตุจักร
チェンマイ:เชียงใหม่
チェンライ:เชียงราย
ドゥシット動物園:สวนสัตว์ดุสิต
ドイステープ:ดอยสุเทพ
パーククローン市場:ตลาดปากคลอง
ハジャイ:หาดใหญ่
パタヤ:พัทยา
パッポン:พัฒน์พงษ์
バンコク:กรุงเทพฯ
バンランプー市場:ตลาดบางลำภู
ピーピー島:เกาะพีพี
ピマイ:พิมาย
プーケット島:เกาะภูเก็ต
プラトゥーナーム:ประตูน้ำ
民主記念塔:อนุสาวรีย์ประชาธิปไตย
ミンブリー:มีนบุรี
ヤワラー通り:ถนนเยาวราช
ラン島:เกาะลาน
ルンピニー公園:สวนลุมพินี
ワット・アルン:วัดอรุณ
ワット:トライミット:วัดไตรมิตร
ワット・プラケオ:วัดพระแก้ว
ワット・ポー:วัดโพธิ์
最近のコメント

相互リンク募集中

Copyright (C) 2007-2010 Thailingual. All Rights Reserved.