開発の動機: 2008年9月アーカイブ

こっそりタイ語エディターを公開しています。

これは、このタイリンガルに登録されている約3000語の単語を編集するためのツールです。

wordedito.jpg






















































こんな画面です。
このFlash(Flex2)を作るのは正直苦労しました。
Flash(Flex2)の開発に慣れてない上に、これまで作ったなんちゃってFlash(Flex2)より構造が少し複雑なので、必要な機能を実現する方法を探すのに時間がかかりました。
なんと丸3日もかかった大作です(自分的には)。

本当はWikipediaの様に多機能で自由に編集できる作りにしたかったのですが、例によって最初の構想が大きくて実現が小さいいつものパターンです。

何でこんなものを作ろうかと思ったかというと、きっかけは放置状態になっている、Windowsアプリのタイ語学習ソフト「タイリンガル」が急に気になり始めたからです。

ダウンロード数をみてみたら、1700を超えていました。
これにVectorに公開している分を加えると2000以上の人がダウンロードして使ってくれたことになります。

興味が次から次にうつる性格なので、タイリンガルのことは放置状態になっていたのですが、これだけ多くの人がダウンロードしてくれているのだから、何とか改善したいなぁ、と思い始めて

 Winアプリ版「タイリンガル」を改善したい
 →同じタイ語データがWinアプリとネット上に重複して存在しているのは更新が面倒&管理が大変
 →タイ語データをネットとWinアプリで一元化したい
 →Winアプリ版にデータ更新機能を備えれば、ネットから最新タイ語データがダウンロードができるはず
 →まず、ネットのタイ語データを整備したい

といった思考過程を経て、まずタイ語データの整備から始めよう。それにはネットのタイ語データを先に整備しよう、と思い立ったわけなのです。

ところが、ネットのタイ語データは更新が面倒です。
何しろデータがMySQLというデータベースに登録されているからです。
管理ツールを立ち上げていちいちデータを修正するのは大変面倒です。
そこで、出てきた結論が今回のタイ語データエディターを作った理由です。

これのお陰で、誰でも自由にタイ語データを編集、追加できるようになりました。
といっても、なかなかそんな面倒なことをしてくれる奇特な人はいないので、まず自分が更新を楽にするためのツールでもあります。

昨日あたりから、早速単語の解説を登録し始めています。
単語というのは、語学学習初心者にとって、いきなりタイ語の単語と日本語訳だけを表示されて、「さぁ、使え」と言われても困ってしまうものです。

私も、日本にいたときに購入したタイ語学習ソフト「Talk Now! はじめてのタイ語 」でそれをやられて大変こまりました。
それをどうやって使ったらよいのか解説してくれたら大変便利です。

ちなみに、このツールにどうやってアクセスするのかといえば

常用単語1700語にチャレンジ!」や「一つ上を目指す人の為の3000語(中級者向け)」の
各カテゴリにアクセスすると

 ・このカテゴリに単語を追加してみる
 ・この単語の解説を書いてみる

なんてリンクが勝手に貼られています。
これをクリックするだけです。

たとえば「あいさつ」カテゴリを表示するとすぐわかるとおもいます。
実は前回公開した「発音記号画像化ツール」はこのタイ語エディターの前準備なのでした。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
前回書いた記事は、実は途中で消えてしまってとても悲しい思いをしました。本当はもっと長かったのですが、消えてしまったので、続きを書く気力がなくなってしまいました。

でも、がんばって続きを書きます。

で、パソコンで使える「音で引くタイ日実用辞典」がずっと欲しかったのですが、誰も作ってくれなので、仕方ないから自分で作ることにしました。

作り方は分かっています。
自分でタイ語辞書を作るわけにはいかないので、既存のタイ語辞書を活用します。
具体的には、こちらのページでパソコンで使えるタイ語辞書を説明していますが、私のPCには「PDICタイ語」と、「白石昇 泰日辞書」が入っています。

このうち、白石氏の辞書には発音記号がないので、変換するのが大変そうです。
しかし、「PDICタイ語」には発音記号があるので、この発音記号を変換してやるのが簡単そうです。
このPDICには辞書ファイルをCSVで書き出す機能が標準でついているので、辞書ファイルをCSVで吐き出してやって、それを「音で引くタイ語辞書」のルールに則って、変換、そしてまたPDICに戻してやれば良いだけです。

実に簡単ですね。
では、なんで構想だけあって、今まで手をつけてこなかったのでしょうか。
それは、以前に変換ツールを作ろうとおもって、「タイ日実用辞典」を詳しく調べていたら、実はルールが非常に多く、変換すると単語の数が膨大に増えてしまうことが分かってきたからです。

この音で引く辞書の「岡滋訓」氏は、後半辞書部分で、検索方法とルールの説明をしているのですが、実はそれ以外にも説明されていないルールが複数存在していて、それらを1つ1つピックアップしているうちに、疲れてきて、ちょっと面倒だな、と思い始めて、そのまま放ったらかしになっていたというわけです。


私が怠けている間に、PDICタイ語のサイトでローマ字引き版辞書PDICタイ語が公開されていました。
私は最初「おぉ!私の求めていた音で引くタイ語辞書か!?」
と少し期待して使ってみたのですが、実際には発音記号を単純にローマ字に直しただけの、似て非なる辞書でがっかりしました。これでは全く意味がないのです。

正確に音が聞き取れた場合にしか使えないのでは、次第に引く気力を失っていきます。私が欲しいのは「耳で聞いたタイ語」が簡単に引ける辞書だからです。

そんなわけで、自分で作ってみました。
当初懸念だった、単語数が膨大に増えてしまう問題は、勝手にルールを追加して単語数の増殖を防ぐようにしておきました。

とりあえず単語の変換ルールが多いので、私が勝手ルールをいっぱい追加しています。
今8割くらいできていて、もう私のPDICでは実際に音で引くタイ語辞書が動いています。
自分で作っておいて手前味噌ですが、簡単にタイ語が引けるのでちょっと感動しちゃいました。

例によって、お手軽に作るために使いなれたVB.NETで作ってしまいました。
手元にあったのがVisual Studio2008だったので、例によって.netframeworkを入れないと動かないかもしれませんが、まぁ、どうせ最初の1回しか使わないので我慢してください。

公開できるのはもうちょっと後になると思いますが、↓こんな感じで動いてます。
「pasi」で税金(phaasii)も引けるようになってます。

oto.jpg






































ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
もうずっと構想だけあって、ほったらかしにしてあった開発にようやく着手し始めました。
その構想とは、『音で引くタイ語辞書』ソフトの作成です。

私は普段ほとんど紙の辞書を使いません。
PCのタイ語辞書ソフトを使っています。
PCのタイ語辞書ソフトの使い方はこちら

ついでに、携帯電話はX01HTを使っています。
これは、Windows Mobileの入った今はやりのスマートフォンというやつで、PC版のタイ語辞書ソフトと同じPDICがインストールできてしまいます。
つまり、PCの辞書ソフトPDICがそのまま、携帯でも使えてしまうので、外出先でもタイ語を調べることができます。

しかしです。
1つだけ紙の辞書でないと困るものがあります。
それが、『音で引くタイ日実用辞典』です。

タイ語というのは、英語を違って発音を聞いて、単語を推測するのが困難な言語です。
例えば

タイ語で『税金』をなんというか知っていますか?
カタカナでいうと「パーシー」です。

この「パーシー」の意味を知らなかったとします。
タイ人に「パーシー」と言われて意味がわからなかった時、どうやって意味を調べたら良いのでしょう?

少しタイ文字を勉強したことがある人なら
「パ」行には、破裂音の「パ(p)」と、日本語の「パ」に近い有気音の「パ(ph)」があることがわかります。

耳の良い人ならどちらの「パ」を言っているのか聞き取れるかもしれませんが、それだけではタイ文字を推測できません。
タイ語には同じ音を表すタイ文字が複数存在するからです。

例えば
 ・破裂音のパ(p)
   『ป』・・・phoo-plaaの
 ・有気音のパ(ph)
   『』・・・phoo-phaanの
   『ภ』・・・phoo-samphawの
   『ผ』・・・phoo-phwnのผ

と「パ」だけで、4つのタイ文字が存在します。
厳密にいえば、『』『ภ』の2つと『ผ』では声調が違いますが、慣れてないと聞き分けるのは困難でしょう。

パ行はまだ良い方で、絶望的なのは「タ行」です。
破裂音の「タ(t)」が3つ、有気音の「タ(th)」が5つ、計8文字もタイ語の「タ」が存在します。

上記はほんの一例ですが、タイ文字というのは、非常に複雑怪奇にできていて音から聞いてタイ文字を推測するのが非常に困難な言語です。

そんなわけで最初の税金に話を戻して、「パーシー」と聞いてその単語を知らないのに

 ・ภาษี

とタイ文字を推測できる人は非常に稀でしょう。

そこで登場するのが、前述の「音で引くタイ日実用辞典」です。
この辞典は、前半辞書、後半辞書の2部で構成されています。

前半の辞書は、聞こえた音をそのまま、発音記号で引くことができます。
例えば、「パーシー」と聞こえたのであれば、「paasii」又は「phaasii」と推測できるので、とりあえず

 ・「paasii」

で引いてみます。
・・・出てきません。
つまり破裂音の「パ」ではなかったのです
従って、有気音の「パーシー(phaasii)」で引いてみます。

・・・出てきました!

 ・「phaasii」(←実際には[i]のところに声調記号がついています)

で、「税金」「ภาษี」と引くことができます。

でも、タイ語の発音に慣れていない人は、「パ」が破裂音なのか、有気音なのか聞き分けができないかもしれません。前半の辞書ではうまく引ける可能性は1/2です。
これは面倒ですね。

その為に、後半の辞書が役に立ちます。
この後半部分の辞書は

 ・あるルールに則って
 ・聞いた音をローマ字に置き換えて引く

だけの非常に簡単な辞書です。
基本的に知っておくルールが少し存在しますが、非常に簡単です。

具体的にルールの例をあげると

 1.ラ行の[l]と[r]は、日本人には聞き分けにくいので、すべて[r]に置き換える
 2.パ行の[p]と[ph]は、すべて[p]に置き換える
 3.母音・子音にかかわらず同じ音が2文字以上連続したら、それを1文字にする

といった具合です。
3のルールが少し特殊でわかりにくいかもしれません。
例えば「パーシー(phaasii)」ですが、人によっては「パーシ」や「パシー」又は「パシ」と聞こえた人がいるかもしれません。

そうすると2のルールに則って[ph]も[p]もすべて、[p]で検索できるとしても

 ・paasi
 ・pasii
 ・pasi

と、候補がいくつか出てきてしまいます。
それを1回で検索できるようにするための仕組みが3つめのルールなのです。

つまり、「paasii」も「paasi」も「pasii」も「pasi」も検索するときは

 ・pasi

です。
実際に今辞書を引いてみたら、「pasi」で

 ・[paasii][税金](←実際には[i]のところに声調記号がついてきます。)

と出てきました。

私はこの後半部分の音で引く辞書こそ、パソコンでの検索に適していると思っていました。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る

このアーカイブについて

このページには、2008年9月以降に書かれたブログ記事のうち開発の動機カテゴリに属しているものが含まれています。

前のアーカイブは開発の動機: 2008年1月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

開発の動機: 2008年9月: 月別アーカイブ