タイリン: 2009年11月アーカイブ

前回までのエントリー


の続きです。

ここまでの結論としては

 ・MS-IMEにタイ語辞書を突っ込んでみた
 ・MS-IME2002/2003に予測変換の機能はないが候補のタイ文字が見やすいし比較的使いやすい
 ・MS-IME2007(Office2007版)の予測変換はあまり役に立たない

というものです。
残念ながらMS-IMEではタイリンのイメージしていた機能の50%くらいしか実現できないので、今回は本丸であるATOKを攻めてみたいと思います。


今回試したのは最新版のATOK2009
非常に高機能になっていて驚きました。
ATOKって昔使ってて確かに便利だったんですが、最新版を使ってみてここまで進化しているとは知りませんでした。
今回の目的はタイ語の推測入力を試すことだったんですが、普通に日本語入力の方もMS-IMEよりかなり早く入力できそうなので、この機会にATOKに乗り換えようと思います。

で、ATOKが非常に高機能だったので、どの機能を使ってタイ語の推測入力をしたら良いのか迷いました。
試行錯誤すること丸1日。

で、できました!
さすがATOK!!

どうやら「省入力候補」という機能を使えば良いようです。

手順を書いておきます。

1.タイ語辞書取り込み手順

ATOK01.jpg


































↑ まず、ATOKメニューから「辞書メンテナンス」を選びます。



ATOK02.jpg













↑ サブメニューが展開されるので「省入力データ編集ツール」を選びます。





ATOK03.jpg





























↑ 省入力データ編集ツールの画面
「取り込むデータ」で「テキストファイル」を選びます。


ATOK04.jpg















↑ 「取り込みファイル」に音リンガルで生成したCSVをちょこちょこっと加工したデータを選択します。
(加工の方法は後ほど説明)

「未登録データ出力先」ってのは、インポートできなかった単語のログが出力される先みたいです。
とりあえず適当に出力先を指定。

「取り込み実行」ボタンをクリックすると辞書データの取り込みが完了します。



2.取り込みデータのフォーマット

ATOK05.jpg


















↑ これが音リンガルで自動生成されたCSVをメモ帳とかで開いたところ。
カンマ区切りですね。
これをATOKで取り込める形に変更してやります。
タイリンは例によって秀丸の置換を使いましたが、EXCELを使っても可能です。



ATOK06.jpg



















↑ これが、ATOKで取り込みできるフォーマット。タブ区切りになってます。
(重要!)タイ語と日本語訳の間には「タブが2つ」入ってます。この事実がATOKマニュアルのどこにも書いて無くて、ここにたどり着くのに非常に苦労しました。


3.使ってみよう!

とりあえず使ってみましょう。
ポイントは「半角英数固定」を選ぶことです。

ATOK07.jpg

















↑「半角英字」でも良いような気がするけど違いはまだ調べてません・・・。
 何しろ色々調べることがあったので・・。



3-1.ポムラックムァンタイ(ผมรักเมืองไทย)とタイ語で書いてみよう!!

簡単な文章を作ってみます。
「ポム」「ラック」「ムァンタイ」と入力してみましょう。
ATOK08.jpg








↑ 「pom」と入力したところ。
ここで「TAB」キーをクリックすることで「pom」から始まる単語の候補一覧を表示することができます。




ATOK09.jpg

















↑ 候補一覧が表示されます。非常にたくさんあります。
タイリンは既に一度「ผม」を入力したことがあるので、ATOKの学習機能によって候補の一番上に来てます。
「エンター」キーを押して確定します。


ATOK10.jpg











↑ 続いて「ラック(rak)」、「ムアンタイ(muantai)」と入力して次々に確定してきます。

これだけ!!
なんとも非常に簡単にタイ語の文章(ผมรักเมืองไทย)が入力できてしまいました。



ATOK11.jpg







↑ ちなみに、ATOKはなかなか賢くて一度入力した文章を覚えてるみたいです。
「pomrakmuantai(ผมรักเมืองไทย)」と一度入力したことがあればいきなりタイ語に文章を変換してくれるという親切設計。


ATOK11-2.jpg









↑ 「Tab」キーを押すと候補が表示されます。
さすがに日本語訳は表示されませんが(登録してないし)、自分で入力した文章なので日本語訳がなくてもなんとかなると思います。



ATOK12.jpg







↑ 「pom」と再度入力したところ。
今度は先ほど入力した「ポムラックムァンタイ(ผมรักเมืองไทย)」が候補の一番上に来ていますね。
これがATOKの学習機能です。
「Shift」+「Enter」でいきなりタイ語に変換することもできますし、「Tab」キーで候補一覧を表示することもできます。



3-2.MS-IME2007で敗北した「インディーティーダィルージャック」に再挑戦してみよう!

ATOK13.jpg







↑ 「yin」とだけ入力して「Tab」キーをクリック。

ATOK14.jpg

















↑「yin」から始まる候補一覧が表示されます。
「知り合いになれて嬉しいです」を選んで「Enter」で確定!

MS-IME2007と違い、3回も入力する必要はありません!
一度も入力したことがない用語でもちゃんと候補表示してくれます。



ATOK15.jpg








↑ 学習機能によって、「yi」と入力しただけで、先ほど確定した用語が候補の一番上に来ています。
非常に便利。



ふー、書くの疲れた。

とまあ、機能の差はMS-IMEとATOKでは歴然としているんですが、そこまで便利じゃなくても
MS-IMEでも疑似推測入力ができる方法をニヤーイさんが発明してくれました!


4.(おまけ)MS-IMEで疑似推測入力する方法

辞書の方を加工して、各単語の読み方を最初の3文字だけにした新しい辞書をつくり、IMEに追加します。
(元の読み方はそのままIMEに残っています)
たとえば、このように。

aro อร่อย
aro อารมณ์
aro อารมณ์ดี
aro อารมณ์เสีย

これをIMEに追加登録して、「aro」と打ち込んで変換すると、上の4行が全部表示されるので、その中から選択します。

場合によっては候補が10個以上になるので探すのが大変ですが、全文字打ち込むよりははるかに楽でしょう。

しかもIMEの学習効果で、よく使う候補はリストの上位に集まってくるので、使えば使うほど探すのが楽になってきます。

やり方は、

1.辞書の加工は、エクセルで、左3文字を取り出す関数を使えば、すぐできます。保存はUnicode textで。
(私のはエクセル2002英語版ですが、無料版辞書24000行なら読み込みはあっという間です)

2.IME登録のとき失敗単語がボロボロ出ますが、これは読み方を最初の3文字にしたため、「読み方+単語」の重複が発生したからです。本家は1個だけ登録されるので、気にしなくていいです。


最初の2文字では候補が多すぎます。3文字ってのがポイントですね。

3文字入力すればかなり候補が絞られるのでかなり便利になるのではないでしょうか。


結論:まず、MS-IMEで疑似推測入力を試してみる。でも、もっと便利なのがいいよ!という人はATOKを導入してみてください。



ATOK 2009 for Windows 通常版
ジャストシステム (2009-02-06)
売り上げランキング: 243



ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
さて、前回のエントリー


で、IMEにタイ語辞書を突っ込んでしまうという画期的な発明をしたにも関わらず特許を取り損ねた話を書きました。
今回はその続き。

今日のテーマはずばり!

Office IME 2007の予測入力を試そう!

です。
前回試したのはOffice2003にデフォルトでくっついてくるIME2003なんですが、2003に無くて2007にだけ有る便利な機能があります。

それが、「予測変換(Microsoftは予測入力と呼んでる。)」です。

予測変換って携帯で日本語入力するときに候補を表示して選ばせてくれるあれですね。

で、早速試してみました。

あ、その前にIMEのバージョンについて軽く説明しましょう。

VistaにもIME2007と呼ばれるなんちゃって2007が付いてきますが、このIMEには「予測入力」機能はありません。
Vista IME2007とOffice2007をインストールしたときに一緒にインストールされるOffice IME 2007は別物です

で、タイリンはタイに住んでるので、Office2007も入ってるんですが、英語版のOfficeです。
これをインストールしても、Office IME2007はインストールされないみたいです。
日本語版のOffice2007をインストールしないとダメみたいですね。

が、諦めるのはまだ早い。

実はOffice IME 2007ってのは無料でインストールする方法があります。

その方法とは・・・

って説明するのはここの本題じゃないので、

この辺の説明をみてください。

Windows Live IDを取得(無料)すれば、誰でもOffiice IME2007がインストールできます。
特に有効期限もありません。

で、とりあえずOffice IMEがインストール終わったので、タイ語辞書をIMEにインポートしてみました。

・・・・。


・・・・。


・・・・。

遅い。遅いでござーる。

ime2007import.jpg














↑がんばってインポートしてるところ。12万件くらいあります。

IME2003の時は一瞬で終わったインポートがいつまでたっても終わらない!
なぜ性能が退化する!?


なんとあり得ないことに5分くらいかかってようやく取り込みが終わりました。

で、早速使ってみます。
ポイントは、「半角英数」じゃなくて、「全角英数」を選ぶところ。

ime2007-1.jpg












IME2007になって、「直接入力」が無くなったみたいで、「半角英数」が「直接入力」みたいな扱いになった様です。
ちょっと見た目が不格好になりますが、仕方ありません。

気を取り直して、とりあえず前回と同じ「ran」を入力。(←後で気づきましたが前回は「ran」じゃなくて「rap」でした。ま、いーけど・・・。)

ime2007-2.jpg






↑ 「全角英数」なので見た目がちょっと不格好。

そこは目をつぶって、「変換」ボタンをぽちっと押すと・・・



ime2007-3.jpg




















前回と同じように候補が表示されます。

・・・が、なんというか・・・

ポップアップのタイ語が小さいよ!!
見づらいじゃないか!!!
しかも余計なスペース空けすぎ!!!!
「環境依存文字」とか余計なお世話じゃ!!!!!


・・・と、なんか最初から使いづらさ満載感が漂ってるんですが、とりあえずそこにも目をつぶりましょう。
何しろ「予測入力」という画期的な機能が付与されているのですから。

で、「予測入力」の恩恵を最大限に得るためにサンプルとしてちょっと長めのタイ語を選んでみました。

それは・・・

ยินดีที่ได้รู้จักครับ」(インディーティーダィルージャック クラップ)・・・初めまして、お知り合いになれて嬉しいです。

これです。
これを正統派方式で入力していたらちょっと大変ですね。
長い文章を打ち込むとスペルミスもあるかもしれません。

で、早速試してみました。


ime2007-4.jpg








「yinditidairujakrap」っと

あれ?

全部打ち込んでしまったぞ。
一体いつ予測入力してくれるの?

ここにきて、初めて「予測入力」の使い方について調べてみますた。

すると・・・

・・・なんと!!!



以前に入力した文章!!!

色々調べてみると、どうやらこの「予測入力」という機能は

「以前に3回以上変換したことのある単語について」

予測入力をしてくれるそうです。

 ガ━━(゚Д゚;)━━━ン! 

3回って・・・

それって意味あるのか!?


仕方ないので3回入れてみました。

ime2007-5.jpg












↑ 1回目。

無事変換できました(当たり前じゃ)。

2回目。

3回目。

そして運命の4回目!!

キタ━━━━ヽ(・∀・` )ノ━━━━!!!! 

↓これです。

ime2007-6.jpg













↑これ。
TIP UPで「TABキーを押すと予測候補を表示します」と表示されますた。

そして指示通りに「TAB」を押してみると・・・ ↓

ime2007-7.jpg
















予測変換キタ━━━━(゚∀゚)━━━━!!!!

最初の2文字「yi」を入れた時点で予測変換が来ました!

・・・って遅いよ!!!!
3回も入力さすな!!!!

まったく。
携帯電話のIMEでさえ入力してない用語の予測変換できるのに、なぜPCのIMEがその程度のことできない?


というか、予測変換とか置いておいて、IME2007って本当に変換精度が悪いですね。
IME2003もひどかったけどさらに退化してない?

と、感じているのはタイリンだけじゃなく、実はマイクロソフトの元社長、古川氏もブログで同じこと言ってます。


某MS社員に、「MS IME最近どうなっているのよ?」と先週聞いた答えが...
「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......
個人的にはATOKに切り替えようと思っている」と言う現役開発系社員の発言に絶句!!! 


MSの社員がATOKに乗り換えるって・・・・( ゚Д゚)ポカーン
しかし、IMEって中国で開発してたのか。
だから時々妙に難しい漢字が候補の上位に出てくるわけだ。


結論:Office IME 2007の予測変換のメリットは薄い、さらにIME2007自体の頭が悪すぎます




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ文字入力ソフトの記事が続きます。

例によって以前のエントリー


で、タイ文字入力ソフトが作りたいと書きました。

いきなり作り始めず、ずっと構想を練っていました。
どんな入力方法が一番便利なのか、パフォーマンスが最適で、かつユーザーインターフェースが使いやすいこと。

どんな方法がいいのかな~って色々調べてたら1つの光明が!

なんと!
何の開発もなく、タイ文字の入力を画期的に早くする方法を発見してしまいました!

その方法とは・・・

「日本語IMEにタイ語辞書をつっこんじまえばいーんじゃない!?」

という画期的なもの!!

実際に試してみました。
百聞は一見に如かず。
下の例を見てください。


thaiinput2.jpg





↑「rap」と入力し「変換」ボタンを押すと・・・

thaiinput1.jpg



























なんと!
該当するタイ語が候補選択できてしまう!!

という画期的なもの。

色々複雑なことを考えていたんですが、シンプル・イズ・ベストなことに気がつきました。

仕組みはいたって簡単です。

1.音リンガルコンバーターで生成したCSVファイルを秀丸でちょいっと加工
  (IMEで辞書取り込みできる形式に直しました)
2.IMEで辞書取り込み

こんだけ!!
なんと2アクションでタイ文字知らない人もさくさくタイ人とチャットできてしまうという画期的な仕組みです。
(変換候補に日本語の意味が表示されるので、そこから選ぶだけ)

1を軽く説明しますと、音リンガルコンバーターで生成したCSVってメモ帳とかで開いてみると
↓こんなフォーマットになっています。

thaiinput3.jpg



















CSVっていうくらいなので、カンマ区切りですね。(Comma-Separated Values)
これをIMEでインポートできるフォーマットに直してあげます。
具体的には、カンマ区切りじゃなくて、タブ区切りにしてあとちょこちょこって修正するだけです。


thaiinput8.jpg



















なんとなく、こんな形になっていればOK。
色んな方法があると思いますが、とりあえずタイリンは秀丸で置換しただけです。


あとは、IMEの「ツール」→「辞書ツール」を開いて・・・

thaiinput5.jpg
















↓ 「テキストファイルからの登録」で、さっきタブ区切りにしたテキストファイルを選択します。

thaiinput6.jpg















あとは、勝手にどんどん取り込んでくれるので、これで完成です。
さっき試したら13万件くらい取り込まれちゃいました。
処理はかなり早いです。



で、使い方のポイントですが・・・・
thaiinput7.jpg
















「入力モード」を「半角英数」にします!!!(重要!)
(ちなみに、Office2007をインストールしてる人はOffice IME 2007がインストールされていて、「半角英数」では変換が使えないみたいなので、「全角英数」を使ってください。)

IMEってほとんどの人は「直接入力」か「ひらがな」しか使わないと思いますが、
「半角英数」にすると、アルファベット入力にもかかわらずタイ文字に変換ができてしまうのです。

なんとシンプルで画期的!!

特許をとろうかとも思ったのですが、残念ながら誰でも真似できるほどシンプルな方法だったのでここに公開しておきます。


ちなみに秀丸で置換って、わかってる人はあっさり実現できちゃうと思いますが、知らない人には敷居が高いと思うのでそのうちツールを作っておきます。

個人的な経験では、タイ文字入力って日本語入力に比べると3倍くらい難しい気がします。
タイ語初心者が正攻法でたどたどしくタイ文字入力するスピードに比べて、上記方法だと10倍くらい早い気がします。
(上級者ともなれば、正攻法の方が早いですけどね!)

ちなみに、Office 2007を使っている人はOffice IME 2007がインストールされているので、「予測入力」が使えます。さらに便利。(重いけど)

いずれにせよこれ実現したかったでタイ文字入力ソフトの50%完成してしまいました。
(当初イメージしていた方式とはかなり違った形になっちゃいましたが)

しかし、まだこれだけでは50%、現状ではゴールまでまだまだ道半ば、かな。

もうちょっと構想を練らねば。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
以前のエントリー


で、「タイ文字入力ソフトが作りたい」と書きました。

思ったからといってすぐに作り出さないのがタイリンの良いところ。
入力ソフトってのは使い勝手が非常に重要なので、最初の構想が非常に重要です。
適当に作り始めると結局何の使い物にもならない無駄なソフトが出来上がってしまいます。

で、構想を練るために、考えました。
他の言語の入力ソフトってどうなってるのかな~。

って思ってたら、中国語の入力ソフトがすごいことになってたみたいです。


↑この記事によるとGoogleが開発した中国語ピンイン(入力)ソフトがすごいらしい。

ローマ字を入力してさくさく中国語に変換できちゃうらしいのです。

chinesepinin.jpg



















↑中国語が読めないけど、なんかすごく簡単に変換できそう ヽ(・∀・`*)ノヤッタ━゚

そもそもマイクロソフトのIMEがあるはずだと思うんですが、なんでわざわざGoogleが入力ソフト(IME)を開発したのかって言うと、マイクロソフトのIMEには色々不満があるらしいのです。
それを解決するためにGoogle自ら開発してしまったのだとか。

Googleは世界中の優秀な技術者を集めているので、当然中国人のプログラマーも多数在籍しているのでしょう。
このIMEは彼らの努力の結晶と思われます。

タイリンはタイ語の文字入力もピンイン(変換)方式にしてしまえば良いと思っています。
こんな優秀な中国語入力ソフトを開発できるGoogleなので、タイ語の入力ソフトだってあっという間に実現してしまうことでしょう!

後はGoogle社員になれるほどの優秀なタイ人技術者が増えるのを待つだけ!!!

・・・実現は遠いなぁ・・・。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイに住んでいる日本人ならば、大抵の人が知っている法則があります。

それは

タイ人に何かを依頼するとき、同じ内容を3回繰り返して伝えなければならない

という絶対原則です。

タイリンはタイに住み始めて1ヶ月目くらいにこの法則に気づきました。

タイ語学校に通っていたころ、同じクラスの仲間と学校近くのタイ飯屋でご飯を食べていました。
ここはお昼時は客がいっぱいで、なかなか料理が出てきません。
味は悪くないんですが、店員のサービスは本当にひどかった店です。

店員「何になさいますか?」
タイリン「えーとね、俺はカオムーデーン!」
店員「はい」 (←メモメモ)





・・・20分後・・・




来ない。
来ないでござる。

まさか注文を忘れてるなんてことは?      (←実際に忘れてます)
いや、まさかそんなことはないだろう、さすがに。メモとってたし。
きっと客がいっぱいで作るのに時間がかかってるんだろうな。(←忘れてるだけです)
もう少し待ってみよう。 (←日本人的発想)



・・・30分後・・・



来ないでござる。バザールに行くでござーる。

タイリン「あのー、料理がまだ・・・」
店員「何注文しました?」      (←完全に忘れてる)
タイリン「いや、カオムーデーンを・・・」
店員「ちょっと待ってて」       (←謝罪の言葉はない)

店の奥に消える店員。
決して謝罪の言葉はありません。 (←客が多いのが悪いのだ。決して自分が悪いわけではない。給料安いし)

そして40分後。

ようやく空腹を満たすことができました、めでたしめでたし。

タイリンだけ飯にありつけて、友人がありつけないこともありました。
そんなことを何度か繰り返すうちに、タイリンと友人はようやくタイにおけるある絶対法則に気がついたのです。

タイ人に何かを依頼するとき、同じ内容を3回繰り返して伝えなければならない

2回ではまだ不十分です。
3回です。

タイ人の脳内で超短期記憶が短期記憶に変わる為には(←長期記憶ではない)
3回同じ内容をインプットしなければならないからです。

これはタイ人と待ち合わせをする場合にも同じです。
時間通りにタイ人を待ち合わせ場所に呼びたければ3回電話をする必要があります。

タイリン「今どこ?」
タイ人「あー、もう近く、もうすぐ着くから」 (←言ってみただけ、実際は近くにはいない)

ひどいタイ人になると、「もう着く」と言いつつ、電話の向こうでテレビの音が聞こえることすらあります。

まだ家かよ!!!


ここで3回電話するのは、相手にプレッシャーを与える意図があります。

「自分はもう待ち合わせ場所で待っている、すぐに来るのじゃ!!」

と、自分の主張を強烈に伝えなければなりません。そして3回です。
ここまでしてようやく相手の思い腰を上げることが可能になります。

繰り返しますが重要なのは

3回の法則

です。




そして、現在。


タイに何年も住んでいるはずなのに、当然誰もが知って然るべきこの法則を知らない日本人が身近にいたりします。

彼はタイ人に仕事を依頼します。

たった1回だけ、しかも口頭で

この仕事の進め方は、タイリンの目にはこう映ります。

「つまりさほど重要でもないし、やらなくてもいい仕事ってことね」

本当に重要で、やって欲しい仕事であれば、メールで伝えた上でさらに口頭でも伝える必要があります。
口頭だけで伝えるのであれば3回繰り返すべきです。

案の定というか、当然の帰結というか、彼の依頼は実行に移されることもなく、

「あれー、ちゃんと言ったはずなんだけどなー」

などと言い訳をしてくる困ったちゃんです。

普通なら1,2ヶ月で気づくこの絶対法則になぜ何年も住んでて気づかない!!


まず、重要なのは


口頭で伝えると3回同じことを繰り返さなければならない


という原則を理解することです。
しかし、3回も同じことを伝えるのは面倒なので、そこで初めて「仕組み作り」の重要さに気がつくわけです。

日本人の仕事は、タイ人にスケジュール通りに依頼通りの仕事をしてもらうことです。
言い換えれば、3回も同じことを繰り返すのが面倒なので、1回伝えただけで依頼を実行してもらうための仕組みを頭をひねって作り出すことです。

タイ人という人種は、どういう性質を持っているのか?
なぜ、「マィサバーイ」とか言って会社にこないのか?
しかも、来ない日は決まって金曜日、または月曜日なのか?
なぜ遅延してるのに報告してくれないのか?
仕様を勝手に変えるのはいかんだろう!

等々、日本人なら何も言わなくてもうまく回る仕事が、当たり前のように回らないのがタイ人なのです。

大事なのは仕組みなのだ、とつぶやいて困ったちゃんの日本人を遠くから眺めるタイリンなのでした。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
少し前のエントリー


で、Googleカレンダーを使うと実はタイの祝日+イベント情報の管理が簡単なのだ、と書いたら・・・


なんと ↓

thaievent.jpg





























キャプログ「タイのイベントカレンダー」登場!!!




真似された!!!!Σ(゚Д゚;)








・・・ってのは冗談で、キャプログがあのエントリーを見てたとも思えないのだけど
それはそれとして、なかなかしっかりイベントが登録されてていい感じみたいです~(´ε` )

そもそもイベントカレンダーみたいに、常時更新の必要な作業はものぐさ太郎なタイリンには不可能でござる (´Д`)ハァ…

餅は餅屋、煎餅は煎餅屋にまかせるでござる。

タイリンガルのサイトではイベント追加するのが面倒なので、あとのことはキャプログサイトに任せるでござる (´∀`*)ウフフ

と、頼まれもしないのに勝手に後を託してみたエントリーです。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ語学校でタイ語を習っていたころ、これは「非常にタイ語的な表現だなぁ」と感じた表現があります。

それは「マィ・オーク」を使った表現で、例えば

・คิดไม่ออก(キット・マィ・オーク)・・・考え付かない、思いつかない

みたいに使います。

・คิด(キット)・・・考える
・ไม่(マィ)・・・否定文を作る
・ออก(オーク)・・・出る

つまり、「マィオーク」で

「出てこない」

という意味になるのですが、この「マィ・オーク」という表現は、人間の五感に絡めて使うことが多く、かつ、日本人には発想しにくい使い方をすることが多いのです。

「マィ・オーク」を使った表現としては、例えば


・คิดไม่ออก(キット・マィ・オーク)・・・考え付かない、思いつかない
・อ่านไม่ออก(アーン・マィ・オーク)・・・読めない、読むことができない
・หายใจไม่ออก(ハーィジャイ・マィ・オーク)・・・息ができない、呼吸ができない
・นึกไม่ออก(ヌック・マィ・オーク)・・・思い出せない
・พูดไม่ออก(プート・マィ・オーク)・・・言葉がでない、言い出せない
・ดูไม่ออก(ドゥー・マィ・オーク)・・・見ることができない、そういう風には見えない

的な表現ががあります。

คิดไม่ออก(キット・マィ・オーク)程度の表現であれば、「考えが出てこない」という日本語的発想からタイ語を思いつきますが、

อ่านไม่ออก(アーン・マィ・オーク)とかหายใจไม่ออก(ハーィジャイ・マィ・オーク)とかになると、日本語の表現からこれらのタイ語を導き出すためにはかなりの発想的ジャンプを必要とします。

しかし、タイ人にとってはごく日常的な表現らしく、この「マィ・オーク」的な表現はよく耳にするので、身に着けておいたほうが便利な表現であることは間違いありません。

予断ですが、หายใจไม่ออก(ハーィジャイ・マィ・オーク)は、例えばタイ人の彼女とケンカする場合なんかに有効です(?)

・อยู่กับเธอ หายใจไม่ออก(ユー・ガップ・トゥー ハーィジャイ・マィ・オーク)・・・お前と一緒にいると息が詰まるんだよ!!

できればこんな表現を使わざるを得ない状況には陥りたくないものです・・・。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
インターネットの普及がもたらした学習の高速道路と大渋滞

上記は少し古い記事ですが、タイで働く日本人SEが平和な理由についての本質をついているので引用してみます。

私は将棋の羽生さんの本を何冊か持っている羽生さんファンですが、さすが本質を見抜いた発言をされています。


この10年のITの進化とインターネットの普及によって将棋の世界の何がいちばん変わったか。

羽生さんは簡潔にこう言った。

「将棋が強くなるための高速道路が一気に敷かれたということだと思います。でも、その高速道路を走り切ったところで大渋滞が起きています」

記事にもあるように、インターネットの普及によって変わったのは将棋の世界だけではありません。

はっきりいってタイで働く日本人SEはかなり平和です。
理由はタイ人SEとのスキルが歴然としているからです。

タイ人SEの仕事を見ていると本当に簡単なことも知りません。

それなりの大学を出たスタッフであっても、そのスキルは全然大したことないです。
特に問題解決能力が低いのです。

システム開発の仕事というのは自分の知識で解決できる範囲の開発をしている間は問題ないのですが、最も解決に時間がかかるのは、未知の問題に出会ったときです。

後で考えれば些細な問題も、四苦八苦しているときは丸一日かけても解けないこともしばしばです。

SEの仕事というのは、壁にぶつかってそれを解決して、そのときの経験をスキルとして蓄積する、その繰り返しです。
日進月歩の世界なので次々に新しい知識を蓄積して、次々に新しい問題にぶつかります。

で、タイ人と日本人の違いです。
自分の知っている経験で解けない問題に出会ったときの解決能力の差がタイ人と日本人では歴然としています。

その理由は簡単です。

日本人の頭脳が優秀だから・・・というわけではありません

「日本のほうがタイよりもインターネットが先に普及したから」

たったそれだけの、しかし非常に重要な理由です。

もう少し詳しく説明します。

そこそこ優秀なSEになるための高速道路が日本語サイトのそこかしこに整備されてるのです。
Googleで検索すれば、たちどころにどんな問題も答えが用意されています。

仮に、優秀なPGが出来上がる方法を考えて見ましょう。
PGの仕事は仕様通りのプログラミングをすることです。

しかし、実はプログラミングという手法は自由度が高く、効率的でわかりやすく、かつ生産的なソースコードを書くPGもいれば、非生産的で、メンテナンス性の低い間違ったプログラミングをするPGもいます。

優秀なソースコードを書くための最も簡単な方法は「ネットから先人の切り開いた最も洗練されたソースコードをコピーする」ことです。多くの場合既に自分より優秀な人がサンプルを公開してくれているので、後はGoogleで適切なキーワードを入れて、見つかったソースコードをコピー&ペーストする、というのが現代の優秀なPGへの近道です。

ネットも使わず、自分の頭脳だけで試行錯誤しながら作ったソースコードは、ネットからコピー&ペーストしたソースコードに遠く及びません。

つまり、ネットを使って先人の知恵を遠慮なく拝借することができる日本人はそれだけでタイ人よりも遥かに優位な状況にあります。

自分が何かの問題にぶち当たって困ったとします。
もしかして、誰か他の人も同じ問題で困っているのではないか?
と思ってググッてみると案の定、先人が解決してくれたりします。ありがたやー。

羽生さんの言葉を借りれば「高速道路が敷かれている」状態です。
羽生さんは、

「それなりの強さとはどれくらいですか?」

と聞かれ

「奨励会の二段くらいまででしょうか」

と答えていますが、タイのIT業界では二段レベルのSEでさえかなり不足しています。
何しろタイ人にとっては、ブロードバンドがようやく普及し始めた程度なので、まだ一般道をのんびり走っている状態です。

タイ人が一般道で制限速度60キロの道路を信号につかまりながら走ってるのに、日本人だけ高速道路を100キロで走ってる

のがタイで働くSEの現状です。サバーイサバーイ。

じゃあ、タイに高速道路が敷かれるのはいつ?

って時々考えるのですが、まず、高速道路がしかれるには少なくとも3つの条件が必要です。

 ・ブロードバンドが普及していること
 ・ブログが普及していること
 ・SEの絶対量が増えること

高速道路が敷かれる為には「SEの中でもそれなりに優秀で、かつブログでその経験と知識を披露してくれる」人が出てこないといけません。そんな親切な人はIT業界でも一定の割合でしか存在しないので、IT従事者の絶対量がそれなりに必要で、付け加えるならアフィリエイト等のインセンティブも必要になってくるでしょう。
もちろんブロードバンドの普及は絶対条件です。

以上から考えても、少なくともあと5年くらいはサバーイサバーイではないかと見ています。


今、日本でSEをされている方で、既に高速道路の先の大渋滞に巻き込まれていると実感されている人は、タイに来てみるといいかもしれません。

少なくとも後、数年は平和に暮らせますよ。

その後の保証はありませんがw

決断力 (角川oneテーマ21)
羽生 善治
角川書店
売り上げランキング: 3739

シリコンバレーから将棋を観る -羽生善治と現代
梅田望夫
中央公論新社
売り上げランキング: 21970




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
たぶん今年になってからだと思うけど、Google翻訳を使って「日本語→タイ語」、又は「タイ語→日本語」翻訳ができるようになっています。

なかなか将来を期待させてくれるサービスなんですが、残念ながら現在の時点ではほとんど使い物にならない程度の翻訳をしてくれます。

つまり、ほとんど役に立たないです。

その原因の1つは、Google翻訳のシステムです。
実は「タイ語」から「日本語」、又は「日本語」から「タイ語」に直接訳しているわけではなく、いったん英語翻訳を間に挟むのです。

つまり、「タイ語」→「日本語」に翻訳する場合

・「タイ語」→「英語」→「日本語」

と2段階を経て日本語に直されるため、もともとの文章からかけ離れた訳が出てくることがしばしばです。
なぜこの様なシステムを採用しているのか正式な理由はわかりませんが、想像するにネットに公開された対訳のボリュームの関係でしょう。

以前何かの記事で読んだのですが、Google翻訳のシステムはネット上に大量の対訳(たとえばタイ語と日本語が1対1に対応する翻訳文)が大量に存在すればするほど、精度が向上するそうです。

つまり、「タイ語」→「日本語」の対訳の絶対量が足りないので、とりあえず
「タイ語」→「英語」を経て「英語」→「日本語」に直さざるを得ないようです。

ちなみに、「英語」を間に挟まないといけないのは、タイ語に限らずGoogleで翻訳できる他の言語でもそうだったはずです。


で、本題なのですが、このGoogle翻訳が登場する以前、自分で、なんちゃってタイ語機械翻訳ツールを作ったことがあります。
この記事です。

残念ながら2点ほど問題があって、公開できませんでした。

問題ってのは

 1.辞書データがない
 2.タイ語の分かち書きができない

ってことです。
この機械翻訳ツールを作ったときはPDICタイ語の辞書データを使いました。自分で使う分にはいいのですが、公開するのは問題ありありです。

で、それはともかく本当の問題は2の「タイ語の分かち書きができない」ってことです。

分かち書きってのは、タイ語の文章を単語に区切ってくれるツール(API、又はライブラリ)のことです。

例えば「私は日本人です」をタイ語で書くと

・ผมเป็นคนญี่ปุ่น(ポムペンコンイープン)

となります。

タイ文字は単語と単語の間にスペースを空けません。
英語なら

・I am Japanese

と単語と単語の間に必ずスペースが入るので、どれが単語なのかか明白です。

でも、タイ語には単語と単語の間にスペースがないので、いったいどこからどこまでが単語なのか判断するのが難しいのです。

仮に

・ผมเป็นคนญี่ปุ่น(ポムペンコンイープン)

という文章が与えられたときに

・ผม  เป็น   คน   ญี่ปุ่น(ポム ペン コン イープン)

と誰かが単語に区切ってくれるとしたらどれが単語なのか明白ですね。
これが「分かち書き」というものです。

実はタイ語の分かち書きの研究というのは非常に進んでいて、すでにいくつものライブラリが公開されています。

CTTeX

とか

swath

とか他にもいろいろあります。

ちゃんとあるんじゃん!

っと思うかもしれませんが、残念ながら存在するのは基本的にLinux(Unix)用のツールばかりです。
たま~にWindows用のツールも存在しますが、このタイリンガルのサイトみたいに格安レンタルサーバーで使う為には、PerlなりPHPなりで使える必要があります。

で、散々探したのですが、残念ながらPerl又はPHPの分かち書きの方法は見つかりませんでした。

以前作った機械翻訳ツールは分かち書きができないので、仕方なく頭から1文字ずつ辞書データと突合せをするというかなり強引な力技で作ったもので、CPUの負荷がすごいし、なにより精度が高くありません。

 ・japanese2thai.com

という日本語→タイ語翻訳サイト?がずいぶん前からありますが、ここも「日→タイ」翻訳を提供しているのに「タイ→日」翻訳を提供していないのは、「分かち書き」の問題が解決できていない為と思われます。

お金があれば、Linuxが使えるレンタルサーバーを借りたり、あるいは自分サーバーを立ち上げたりして解決できるのかもしれませんが、個人の趣味でやっているサイトにそこまでは無理です。

というわけで、お願いです。

PHP又はPerlでタイ語の分かち書きの方法をしっているぞ!という人は掲示板まで教えてください。





ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
少し前になりますが、iPod touchを購入しました。

ここにもタイ語辞書を入れようと思ったのですが、基本的にiPhone/iPodアプリは有料なのとこれといった辞書ソフトがなかったので、インストールしないまま放置してました。

残念ながらPDIC for iPhone/iPod touchはリリースされておりません。
Windows Mobile用ならあるんですけどね。

で、EBPocketというPDICと対双璧を成す人気の辞書閲覧ツールがあるのですが、そのEBPocket iPhone/iPod touch版が少し前にリリースされています。


fig5.png

























このツールでもいいかな、っと思ったんですが、iPhoneアプリは基本的に有料です。

が!しかし!!
このEBPocketには有料版(600円)の他に機能が限定された無料版が存在するのです!!

おぉ、すばらしいぞ!

と感心してみたら、これは絶対わざとなんですが、有料版ではPDIC形式の辞書に対応してるのに
無料版ではPDIC形式辞書が使えないのです・・・。

ウソだと言ってよジョー・・・ _| ̄|○



・・・でも、まだ方法がないわけでもありません!

PDIC形式とEBPocket形式(EPWING)は基本的にお互いデータをコンバートするためのツールが用意されていて

PDIC形式 → EBPocket形式

に辞書データをコンバートすることができるのです。
その為のツールがこれ、「EBStudio」なのです! ヤタ━━━━ヽ( ^∀^)ノ

が、またまた問題があって

このEBStudio、なんとありえないことにUnicodeに対応してないのです。
つまり、PDICタイ語はEBStudioを使ってもEBPocket形式(EPWING)にコンバートすることができません。


えーと、要するにです。

結論として、PDICタイ語を「PDIC for iPhone/iPod touch」で使いたければ600円払え!

と言われているわけです。

売られたケンカ(いつ?)を買わないわけにはいきません。
早速、どうすればコンバートできるか調べてみました。

どうやら簡単なのはLinuxをインストールすればそれ様のツールがあるみたいだけど、Windows用にはこれといったツールが見つかりません。

見つからないのであれば、自分で作ればいいんじゃないの?

と思って、EPWING形式について調べてみました。 

・・・1時間後・・・・

・・・・わからん・・・。

全然わからん!!

負けた・・・(早い) _| ̄|○


というか、非常に気合をいれて調べた上でなら作れるかもしれませんが、調査も含めて1日でさくさくっと作れるレベルではないのです。

タイリンの中では基本的にルールがあって、開発に3日以上かかるアプリは開発しないことにしています。

金曜日の夕方に作り始めて、遅くとも日曜日には完成しないツールやらFlashアプリは開発しない方針です。

これまでに作ったWinアプリやFlashアプリやらブログパーツやらはすべて3日以内に作れるものばっかりです。
まぁ、3000語のデータは3日じゃ登録できませんでしたが、アプリ開発については大体1日か2日で完成します。意外と早いでしょう?

しかも文系人間なのでEPWINGやらBOCU(←PDICの辞書形式です)やら難しいことは考えたくないのです。
(PDIC一行形式やらHTML形式を駆使すればなんとかなりそうですが、それもどうもイマイチ)

私の最も重視することは、必然性、そして費用対効果です。
今がんばって無理したとしても、近い将来本家PDIC for iPhone/iPod touchが公開される可能性もあります。
(需要は多いはずなので可能性は高い)

一過性の目的の為のアプリにそこまで労力を割くのは無理・・・。

そんなわけで、1時間悩んで敗北を認めたタイリンです。

今すぐ使いたい人は素直にEBPocketに600円払いましょう。
(他にもiDicとか安い辞書ツールもあります)




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る

このアーカイブについて

このページには、タイリン2009年11月に書いたブログ記事が含まれています。

前のアーカイブはタイリン: 2009年10月です。

次のアーカイブはタイリン: 2010年2月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。