音で引くタイ語辞書を作ろう(2)

前回書いた記事は、実は途中で消えてしまってとても悲しい思いをしました。本当はもっと長かったのですが、消えてしまったので、続きを書く気力がなくなってしまいました。

でも、がんばって続きを書きます。

で、パソコンで使える「音で引くタイ日実用辞典」がずっと欲しかったのですが、誰も作ってくれなので、仕方ないから自分で作ることにしました。

作り方は分かっています。
自分でタイ語辞書を作るわけにはいかないので、既存のタイ語辞書を活用します。
具体的には、こちらのページでパソコンで使えるタイ語辞書を説明していますが、私のPCには「PDICタイ語」と、「白石昇 泰日辞書」が入っています。

このうち、白石氏の辞書には発音記号がないので、変換するのが大変そうです。
しかし、「PDICタイ語」には発音記号があるので、この発音記号を変換してやるのが簡単そうです。
このPDICには辞書ファイルをCSVで書き出す機能が標準でついているので、辞書ファイルをCSVで吐き出してやって、それを「音で引くタイ語辞書」のルールに則って、変換、そしてまたPDICに戻してやれば良いだけです。

実に簡単ですね。
では、なんで構想だけあって、今まで手をつけてこなかったのでしょうか。
それは、以前に変換ツールを作ろうとおもって、「タイ日実用辞典」を詳しく調べていたら、実はルールが非常に多く、変換すると単語の数が膨大に増えてしまうことが分かってきたからです。

この音で引く辞書の「岡滋訓」氏は、後半辞書部分で、検索方法とルールの説明をしているのですが、実はそれ以外にも説明されていないルールが複数存在していて、それらを1つ1つピックアップしているうちに、疲れてきて、ちょっと面倒だな、と思い始めて、そのまま放ったらかしになっていたというわけです。


私が怠けている間に、PDICタイ語のサイトでローマ字引き版辞書PDICタイ語が公開されていました。
私は最初「おぉ!私の求めていた音で引くタイ語辞書か!?」
と少し期待して使ってみたのですが、実際には発音記号を単純にローマ字に直しただけの、似て非なる辞書でがっかりしました。これでは全く意味がないのです。

正確に音が聞き取れた場合にしか使えないのでは、次第に引く気力を失っていきます。私が欲しいのは「耳で聞いたタイ語」が簡単に引ける辞書だからです。

そんなわけで、自分で作ってみました。
当初懸念だった、単語数が膨大に増えてしまう問題は、勝手にルールを追加して単語数の増殖を防ぐようにしておきました。

とりあえず単語の変換ルールが多いので、私が勝手ルールをいっぱい追加しています。
今8割くらいできていて、もう私のPDICでは実際に音で引くタイ語辞書が動いています。
自分で作っておいて手前味噌ですが、簡単にタイ語が引けるのでちょっと感動しちゃいました。

例によって、お手軽に作るために使いなれたVB.NETで作ってしまいました。
手元にあったのがVisual Studio2008だったので、例によって.netframeworkを入れないと動かないかもしれませんが、まぁ、どうせ最初の1回しか使わないので我慢してください。

公開できるのはもうちょっと後になると思いますが、↓こんな感じで動いてます。
「pasi」で税金(phaasii)も引けるようになってます。

oto.jpg






































ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る

トラックバック(0)

このブログ記事を参照しているブログ一覧: 音で引くタイ語辞書を作ろう(2)

このブログ記事に対するトラックバックURL: http://www.tlin.jp/MT/MT-4.01-ja/mt-tb.cgi/142

コメントする


画像の中に見える文字を入力してください。

このブログ記事について

このページは、タイリンが2008年9月13日 15:17に書いたブログ記事です。

ひとつ前のブログ記事は「音で引くタイ語辞書を作ろう(1)」です。

次のブログ記事は「音で引くタイ語辞書を作ろう(3)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。