2008年10月アーカイブ

両親がタイへ遊びに来ていたので、ベトナム旅行へ行ってきました。

DSC00004.JPGのサムネール画像






















ベトナム人の話すベトナム語を聞いていると、なんだかタイ語の様に聞こえてきます。
私はベトナム語はさっぱりわかりませんが、ガイドブックの後ろについているベトナム語の解説を読むと、ベトナム語にはタイ語と同じく声調があって、タイ語より1つ多い6つの声調があるそうです。

ただ、南部地方では6つの声調のうち、2つが同じ声調で使われるとのことなので、私が遊びにいったホーチミンでは5つの声調が使われていることになります。

その発音もタイ語と同じく鼻から抜けるような音で、これもタイ語と一緒だなぁ、と感じました。
きっとタイ人はベトナム語を学習するのが早いだろうな、と思います。実際、一緒に行ったパンラヤーは短い滞在期間中にベトナム人からいくつか単語を教えてもらっていましたが、その発音を聞くと、まるでベトナム人が話しているように聞こえてきます。

あぁ、これはタイ語と全然違うなと思ったのはベトナム文字です。
ほとんどアルファベットです。
アルファベットに声調記号がついているだけ、非常に簡単です。
これは、フランス占領時代に発明されて、その後普及したとのこと。
元々のベトナム文字は漢字を7割くらい、オリジナルの漢字っぽい文字を3割くらい織り交ぜて使っていたそうですが高学歴の一部の人にしか覚えられないので、現在のベトナム文字が徐々に普及していったそうです。

↓これがベトナム文字

Tiếng Việt

アルファベットに声調記号がくっついています。
1日くらいで覚えられそうな気がします。

それに対してタイはずっと独立国だったので、幸か不幸かわかりませんが、文字を簡略化する機会がありませんでした。
難解なタイ文字は多くの外国人を悩ませます。

私の友人はタイ文字について
「タイ文字は暗号みたいだ」
と評していました。(彼はタイ文字が読めないわけではなく、タイ文字の字幕で映画が観れる程堪能です)

「でも、タイ文字は暗号のままがいいんだよ。一部の外国人だけが読める。だから読める人にはそれなりのアドバンテージがある。それで良いじゃない」

だそうです。



ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
まったくもってどうでもいい話ですが、この2つ前の記事で書いた、SEOツールで遊んでいたら、タイリンガルの地位が向上してました。

Yahoo+Googleを合わせた総合ランクでタイリンガルが17位→12位にUPです。(検索キーワード”タイ語”)
これはYahooの検索DBが更新されてタイリンガルの検索順位がUPしたためです。

12i.jpg
























ついでに、前回1位だった「TLS」が首位から陥落して、変わりに首位に立ったのは前回2位だった「タイ語 -Online Thai Lesson-」。
まったくどんな魔法を使ったのか、前回5420に過ぎなかった「被リンク数」が今回は「17800」にUP。3倍以上に増えてます。

実にどうでも良い話題でした。




ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
お陰様で、最近タイリンガルのアクセスが増えてきました。

その弊害と言って良いのかわかりませんが、アクセスログをみていると変なファイルを探している人が出てきました。

_vti_bin/shtml.exe/_vti_rpc
_vti_inf.html

こんなファイルへのアクセスが1日10件くらいあります。こんなファイルないのに・・・。

っと思って、ネットで調べてみると、Microsoft FrontPageを使ってWebサイトを作るとこんなファイルができるみたいです。
でも、タイリンガルではFront Pageなんて使ってません。
たぶんセキュリティホールがあるのでしょう。
要はプログラムを使って攻撃されているわけです。

あと、昔からある掲示板にも毎日数百件のアクセスがあって、たぶん大半のアクセスはプログラムによる「宣伝書き込み」攻撃です。
そして、つい最近設置した「タイ語質問掲示板」には、まだ書き込みゼロにも関わらず、同じく数百件のアクセスがあります。「宣伝書き込み」攻撃です。設置したばかりなのに敵も反応が早いですね。

攻撃を受けるのは知名度が上がってきた勲章みたいなものでしょうか?

つい先日のことですが、このブログのコメント欄にも「宣伝書き込み」攻撃がありました!
でも、その1回だけです・・・。
知名度の低さを伺わせます。

と、前置きが長くなりましたが、「パソコンからタイ文字でSMSを送る方法」です。
せっかくタイ文字を習うのだったら、使う機会があった方が楽しく覚えられると思います。
日本からタイにいる友人の携帯にSMSを送ることもできるので、一度試してみてください。
1メッセージ8.3円なので、2.5バーツくらいでしょうか。
そんなに高くないので、私はタイにいるのにも関わらずタイ文字SMSを送りたいときは、パソコンから送ってます。



ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ語とは何の関係もない話。

SEO対策の話題が出てきたので、最近見つけたこれはすごいなぁ、と思えるツールを紹介しておきます。

自分のサイトが診断できるサイトは結構ありますが、ここはかなり本格的。

 ・hanasakigani.jp

ここで、自分のサイトにリンクしてくれているサイトを調べることができます。
普通にGoogleやYahooで自分のサイト名を入れればある程度調べられるんですが、自分でも知らなかったサイトまで出てきてちょっとびっくりしました。

hirinku.jpg











ここで、自分のサイトのURLを入れて「Check!」をクリックします。
すると、自分のサイトにリンクしてくれているサイトを探しに行ってくれます。
正直かなり待ちます。2~3分待つんじゃないでしょうか。
で、結果がこれ。

hirinku2.jpg



























たぶん予想以上の被リンク数(自分のサイトがリンクされている数)が出てきますが、これは恐らく自分のサイト内のリンクを含んでいます。つまり、自分で自分のサイト内にリンクしている数も含まれています。

タイリンガルでいうと、被リンク数が495件も出てきますが、さすがにこんなにリンクされていません。自分リンクを含んだ数です。

ちなみに、表の見方は

PR:Googleページランク
OBL:被リンクされているページに含まれているリンク数(リンク集サイトだとOBLが多い)
HIS:被リンク指数・・・被リンクの重要度を示す独自の指数だそうです。

つまり、重要なのは
 1.ページランクの高いサイトからリンクされていること
 2.ただし、被リンクのページ内に大量のリンクがあるということはリンク集である可能性が高いので価値は低い、OBLは低いほど良い
 3.上記を加味してHISが高いほど良い

タイリンガルで言うと、HISが一番高いのが、Yahooです。
何と41.8です。2番目のHISが5.4(しかも自分リンク)で、自分リンクでない3番目が2.9なのでYahooのHISは圧倒的なのがわかります。

もう1つ面白いのが、「被リンク集一括チェックツール」です。
これは、自分のサイトをチェックするのではなく、自分のサイトに関連したキーワードでライバル?を含めた自分の位置を調べるためのツールです。
正直これがなかなか面白いです。
hirinku3.jpg















キーワードを入力(今回は”タイ語”)して「Check」をクリック。
さっきより待たされます。3分~4分くらい待たされました。

でも、待つだけの価値があります。

hirinku4.jpg



























これがその結果。
恐らくGoogleとYahoo(もしかしたらMSNも?)を合わせた結果の様です。
残念ながらタイリンガルは10位以内に入れませんでした。(贅沢?)

ちょっと表の味方の説明。
「被リンク数」「PR」は先ほどと同じ。
「Y!Dir」はYahooディレクトリに登録されているか否かです。
「ドメイン年齢」というのは、そのドメインが登録されてからの年数の様です。

まず、1位はTLSです。
被リンク数がすごいです。何と1万を超えてます。
ついでにページランクも5と高く、Yahooディレクトリにも登録されています。

これを見た感想としては
 1.上位20位まではかなりの確率でYahooディレクトリに登録されている
 2.ページランクは重要だけど検索順位を決める絶対要素ではない
 3.ドメインの年齢って結構重要

特に3のドメインの年齢って要素は今まで重視してこなかったけど面白い考え方です。
ドメインの年齢っていうのはwhoisというドメインを管理しているサービスで誰でも調査できます。
ちなみに、この検索結果上位50位で一番若いドメインが「タイリンガル」です。
何しろまだ1年経ってないですから。

hirinku5.jpg















「ドメイン年齢」でソートしたところ。
nintendo.co.jpが非公開ってのは面白いですが、とにかく「タイリンガル」のドメイン年齢はたった0.11です。
若い!ってなぜ0.11?単位は年じゃないのかな?

まあ、とにかくよくわかりませんが、確かに長く続いているサイトは検索結果の順位が高い傾向にあるという話は聞いたことがあります。
上位50以内のサイトでドメイン年齢が1未満はタイリンガルだけです(ちょっと自慢)。

また、niftyやplalaなんかのプロバイダーはドメイン年齢が10年を超えていますが、これは普通だと思います。
昔は独自ドメインよりも、プロバイダーのサブドメインにHPを作ることが多かったので、上位50位に入っているサイトでも10年を超えているサイトはプロバイダーのサブドメインになっていることが多いです。

それよりも、TLSです。
独自ドメインにも関わらずドメイン年齢は9.4!
これはかなり長寿の部類に入ります。
ページランクが高く、被リンク数が多い、そしてドメイン年齢も高い。
TLSのSEO対策は実に優秀であることが分かります。

あと気になったのは、Google検索ランキング1位の「Thai Language タイ語にチャレンジ!(旅行に役立つ簡単な会話)」が、このツールのランキングでは29位になっていることです。
タイリンガルよりずっと下です。

理由はただ1つ。
Yahooカテゴリーに登録されていない、ということです。
Yahooで上位に入るためにはyahooカテゴリーに登録されているということは必須事項の様です。
ちなみに、ドメイン年齢は4.2。結構長く続けているみたいです。

と、いろいろ遊べるこのSEOに役立つツールですが、使ってみて正直驚きました。
これを作った人はすごいですね。
こんな処理をしたらサーバーにもめちゃくちゃ負荷がかかります。
もしタイリンガルがこんなサービスを作るとレンタルサーバーの会社に怒られること確実です。
ここはきっと自社サーバーか独自サーバなのでしょう。





ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
それほど熱心にブログを書いているわけでもありませんが、ブログランキングに参加しています。
それで時々タイ語関係のブログを覗いてみるのですが、あるタイ語関連のブログのコメント欄にTLSから相互リンクのお願いをしているのを見つけました。↓こんな感じです。

『相互リンクのお願いについて』

はじめまして突然のコメント失礼致します。

東京・大阪・バンコクにてタイ語の学校を運営しておりますTLSグループの広報担当蛯子(えびこ)と申します。

こちらのブログを拝見させていただいたところ、タイ語学習に関する実用的な情報が詳細に伝えられており大変好感を受けました。つきましては当社のHPやブログからリンクとして紹介させていただきたいと思いコメントを入れさせていただきました。
もしもよろしければこちらのアドレス(link@tls-group.com)までご連絡ください。

また代わりといっては恐縮ですがその際当社のHPをこちらのブログにリンクしていただければ幸いです。
是非ご検討のほどよろしくお願いいたします。

リンクの際にはこちらのアドレスをお使いください。http://www.tls-group.com


タイ語学習に関する情報だったらタイリンガルだって、そこそこ提供してるのに、なんで相互リンクの依頼が来ないんだー、っと別に怒っているわけではないのですが、気になったのでGoogleで「TLS + 蛯子」で検索してみました。

すると、そこかしこで相互リンクの依頼をしていることが分かります。
そんなことは別に良いのですが、TLS広報の蛯子さんはSEOが良く分かっているなぁ、と感心したのでちょっと書きたくなったわけです。

SEOってほとんどの人は知らないと思いますが、Search Engine Optimizationの略で、簡単にいえば「検索エンジン対策」です。
Googleが登場する前までは、yahooによるカテゴリー検索が普通だったのですが、最近はGoogle, Yahooによるロボット検索が一般です。そこで、検索エンジンに引っ掛かりやすくなる為のテクニックが重要になって来ました。それがSEOなのです。

で、なぜTLSはSEOが良く分かっているかと言えば、検索エンジン(特に世界で最大シェアを誇るGoogle)に引っ掛かりやすくするための条件として

 ・同じ分野(ここではタイ語)のサイトから大量のリンクがあるサイトは良いサイトである

があるからです。
タイ語とは関連性のない例えば「芸能ニュース」とかのサイトからリンクをもらってもGoogleは評価してくれません。
つまり、タイ語関係のサイトから大量のリンクをもらうことは検索エンジン対策に重要なことなのです。

で、TLS広報の
蛯子さんが良く分かっているのは、コメント欄の最後の1行です。

リンクの際にはこちらのアドレスをお使いください。http://www.tls-group.com
これです。
私はクリックしてTLSのサイトを見てみました。
・・・どこにもリンク集なんてありません。
はて、相互リンクでは?

そこで、片っぱしからサイトをクリックしてみると、ようやく見つかりました。
「TLSスタッフブログ」の中です。

つまりこういう関係です。

「タイ語関連のブログ」→「TLSのトップページ」にリンク
「TLSトップページにはリンクなし」->「TLSスタッフブログ」->「タイ語関連のブログ」にリンク

ここで重要なのは「ブログ」にリンクを貼ってもらうということです。
リンクを貼ってもらうページはどこでも良いわけではありません。
Googleツールバーをインストールしている人なら知っていますが、「Googleページランク」というものがあります。

このページランクというのは、同じサイト内でもページによってランクが違います。
例えばタイリンガルではトップページはページランク3ですが、中のコンテンツは基本的に2です。
ちなみに、このブログも2です。

通常はトップページのページランクが最も高くなります。
リンクを貼ってもらう場合に重要なのは「ページランクの高いページからリンクを貼ってもらう」ことです。
誰も見ないリンク集からリンクを貼ってもらってもGoogleは評価してくれません。

そして、ブログにはリンク集のページというのは、基本的に無いのでブログにリンクを貼ってもらうということは、必ずトップページからリンクを貼ってもらえることになります。
一番ページランクが高いところからリンクが貼ってもらえるのです。
対してTLSのトップページからリンクが返してもらえるかと言えばそうではなくて、スタッフブログからの相互リンクです。

タイ語関連のブログからリンクを貼ってもらうということは、そのブログから人がアクセスしてくれることを期待しているわけではありません。きっとそのブログからTLSに飛んでくる人はほとんどいないでしょう。そんなことはTLSも期待していません。

重要なのはタイ語関連のブログからリンクが貼られることによって、TLSのページランクが上がるということです。

実際に、TLSのトップページはページランク5です。
これはかなり高いページランクです。

そしてGoogleで「タイ語」をキーワードに検索するとTLSの順位は6位です。
SEO対策がうまくいっているということです。

ちなみに、Yahooで「タイ語」をキーワードに検索するとTLSは1位なのですが、これは2つ意味があります。
1つは上記のSEO対策がうまくいっていること。
もう1つはTLSはYahooカテゴリーに登録されていることです。
タイリンガルもYahooカテゴリに登録されていますが、それとは少し意味合いが違います。
TLSは商用サイトなので、Yahooカテゴリに登録してもらうのは有料です。(タイリンガルは無料です)
登録料は5万円(アダルトサイト、健康食品等のサイトは15万円)。

Yahooには歴史的な経緯から人力による「Yahooカテゴリー検索」と検索ロボットによる「ロボット検索」の二重構造になっています。
その構造の為なのか、Yahooでキーワード検索をすると「Yahooカテゴリ-」に登録されているサイトが上位にヒットする仕組みになっています。
しかもどうやら、有料でカテゴリー登録されたサイトが無料のカテゴリーサイトより上位に来る傾向が高い様です。
有料で登録されたサイトはスポンサー的な意味合いも持っているのでこれは当然かもしれません。

現在の世の中では検索エンジンで上位にヒットするということは、非常に重要な要素です。
世界的にはGoogleが圧倒的なシェアですが、日本ではYahooの方がまだGoogleよりシェアが上です。
実際に、数か月前までタイリンガルはYahooの検索順位が50位とか60位でしたが、Yahooカテゴリに登録されて以来10位近くになりました。

そうすると検索エンジンからサイトに来てくれる人がグンと増えるのです。

SEなのでSEOだとかそんなことをが日頃気になっていて、TLSのSEO対策をみて感心したのでちょっと書いてみました。
こんなこと書くとますますTLSから相互リンクのコメントがもらえなくなってしまいました。
まあ、このブログはページランクが高くないので別に良いのですが・・・。





ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
Windowsアプリ版のタイ語学習ソフト「タイリンガル」を配布しています。
少し前から、というかもう半年以上前からなんですが、このWin版タイリンガルに「改善にご協力を」ボタンを取り付けてあったのですが、半ば放置状態になっていて大変申し訳なかったです。

改善要求リストはここで一覧になっています

特に「テンモー」さんには、大変多くの例文をUPしていただきました。
また、「タオ ホア ングゥ」さんには、多くの修正点を教えてもらいました。
また、掲示板で致命的なミスを教えてくださった「krataay 」さん本当にありがとうございます。

基本的に指摘して頂いた改善点は、ネット上で直しておきました。
ネットは良いからWinアプリ版の方を直せという感じですが、そちらは機能を追加する予定で
一緒に修正点もUPするつもりですので、もう少々お待ちください。
ボタン1つで最新データがネット上のデータベースから取得できたらいいな、っという機能を付けたいと考えています。







ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ語→日本語

の翻訳サービスの実験です。

翻訳サービスを実現するためには2つの機能が必要です。

 1.タイ語の文章で単語と単語を正確に区切ってあげること
 2.大量の辞書データが登録されていること

はっきりいって、どっちも面倒です。
特に1の単語と単語を区切ってあげるのは、面倒なアルゴリズムをプログラミングしてやる必要があります。
それはおいおいやるとして、今回は2の辞書データだけで翻訳してみました。
理論的には完璧な辞書データがあれば、1は不要のはずです。

辞書データですが、今回はただの実験なので最大級の見出し数を誇る「PDICタイ語」を使うことにしました。
私は有料会員なので47000語が登録されています。

単語と辞書データとのマッチングですが、今回は簡単にサクッと作るために、データベースに登録してやることにしました。
で、早速翻訳してみました。

翻訳元のソースは同じく「クルンテープトゥラキット」の

 ・オイルの値段が下がったよ

の記事です。

howtouse.jpg








記事全文をコピーしてテキストエリアに貼り付け。「翻訳」クリック。

以下は翻訳結果
------------------------------------------------------------------------------------------------

ราคาน้ำมัน | ดิบ | ร่วง | 2.36$ | ต่ำสุด | ใน | รอบ | 1 | ปี |
原油価格 | 生の | 【文語】落ちる | 2.36$ | 最下位の | ~の中で | 周期 | 1 | 【類別詞】何歳 |

ราคา น้ำมัน | ดิบ | ใน | ตลาดล่วงหน้า | NYMEX | ร่วง | ลง | ต่อไป | หลังจาก | ตลาด | ปิด | ทำการ | ใน | วันพฤหัสบดี | โดย | ลงไป | แตะ | จุดต่ำสุด | ใน | รอบ | เกือบ | 12 | เดือน |
原油価格 | 生の | ~の中で | 先物市場 | NYMEX | 【文語】落ちる | 下がる | 次に | ~した後で | 市場 | 止める | 仕事をする | ~の中で | 【文語】木曜日 | ~によって | 落下する | さわる | どん底 | ~の中で | 周期 | 今にも~する | 12 | 月 |

กรุงเทพ ธุรกิจ | ออนไลน์ | : | ในขณะที่ | ตลาดหุ้น | ตรี | ทด | นักลงทุน | กังวล | ว่าการ | ร่วมมือกัน | ของ | ธนาคารกลาง | ทั่วโลก | ในการ | ปรับ | ลด | อัตราดอกเบี้ย | อาจจะ | ไม่ | สามารถ | สกัดกั้น | ภาวะเศรษฐกิจ | โลก | ถดถอย |
クルンテープトゥラキット新聞 | 【外】オンライン | : | ~の間 | 株式市場 | 【文語】数詞の三 | 堤防 | 投資家 | 心配する | 指示する | 助けあう | 物 | 中央銀行 | 全世界 | ~において | 調整する | 値引きする | 利率 | たぶん~かもしれない | ~でない | ~する能力がある | 妨げる | 経済状況 | 地球 | 後退する |

ราคาน้ำมัน | ดิบ | ส่งมอบ | เดือน | . | . | ดิ่ง | ลง | 2.36 | ดอลลาร์ | หรือ | 2.65% | มา | ปิด | ตลาด | ที่ | 86.59 | ดอลลาร์ | ต่อ | บาร์เรล | หลังจาก | เคลื่อนตัว | ในช่วง | 85.32-89.82 | ดอลลาร์ |
原油価格 | 生の | 納入する | 月 | . | . | 一直線に | 下がる | 2.36 | ドル | へえ! | 2.65% | 来る | 止める | 市場 | 場所 | 86.59 | ドル | 乗り換える | バレル(石油の量の単位) | ~した後で | 動く | 間に | 85.32-89.82 | ドル |

โดย | หลังจาก | ตลาด | ปิด | ทำการ | ราคาน้ำมัน | ดิบ | ได้ | ร่วง | ลง | แตะ | 84.19 | ดอลลาร์ | ซึ่ง | ถือ | เป็น | จุดต่ำสุด | นับตั้งแต่ | แตะ | 83.50 | ดอลลาร์ | ใน | วันที่ | 15 | . | . | ปี | 2007 | เป็นต้น | มา |
~によって | ~した後で | 市場 | 止める | 仕事をする | 原油価格 | 生の | ~できる | 【文語】落ちる | 下がる | さわる | 84.19 | ドル | ~するところのもの | 手に持つ | できる(能力的に) | どん底 | ~以来 | さわる | 83.50 | ドル | ~の中で | 日付(~月~日) | 15 | . | . | 【類別詞】何歳 | 2007 | ~など | 来る |

ราคาน้ำมัน | heatingoil | ส่งมอบ | เดือน | . | . | ดิ่ง | ลง | 7.59 | เซนต์ | หรือ | 3.04% | ปิด | 2.4186 | ดอลลาร์ | ต่อ | แก | ราคาน้ำมัน | เบนซิน | RBOB | ส่งมอบ | เดือน | . | . | ขยับ | ลง | 0.25 | เซนต์ | หรือ | 0.12% | ปิด | 2.0273 | ดอลลาร์ | ต่อ | แก |
原油価格 | heatingoil | 納入する | 月 | . | . | 一直線に | 下がる | 7.59 | 【外】セント(米国通貨) | へえ! | 3.04% | 止める | 2.4186 | ドル | 乗り換える | てめい | 原油価格 | 【外】ガソリン | RBOB | 納入する | 月 | . | . | 動かす | 下がる | 0.25 | 【外】セント(米国通貨) | へえ! | 0.12% | 止める | 2.0273 | ドル | 乗り換える | てめい |

ราคาน้ำมัน | ดิบ | รน | ส่งมอบ | เดือน | . | . | ที่ | ตลาด | กรุง | ลอนดอน | ดิ่ง | ลง | 1.70 | ดอลลาร์ | ปิด | 82.66 | ดอลลาร์ | ต่อ | บาร์เรล |
原油価格 | 生の | 静かにしていられない | 納入する | 月 | . | . | 場所 | 市場 | 首都 | 【地名】ロンドン | 一直線に | 下がる | 1.70 | ドル | 止める | 82.66 | ドル | 乗り換える | バレル(石油の量の単位) |


------------------------------------------------------------------------------------------------
翻訳結果終わり

複数の日本語訳が登録されている場合は、とりあえず1番目の訳だけ採用しました。

結論としては「PDICタイ語」大変優秀です。
何の最適化もしてないのに、何となく何が言いたいかわかります。

タイ文字のことなんて全然知らない人が見てもなんとなく意味がわかるんじゃないでしょうか。
タイ語のことをちょっとでも知っている人が見るとより理解が深まります。

タイ語というのは「後置修飾」なので、例えば「綺麗な花」と言いたい時は

「花」+「綺麗な」

と「花」に対して後ろから「綺麗な」を修飾します。

上の翻訳結果で言うと例えば「原油価格 | 生の」となっているところは、日本語の語順に直すと「生の原油価格」になります。(まぁ、何となく意味はわかりませんが・・・)


ところで、今回は作りを簡単にするために、辞書データを全部データベースに登録してみました。
この作り方の問題点は、文章が長くなると大量のSQLを発行するはめになる点です。

たぶん上の例で言うと、この文章を翻訳するのにSQLを100回以上発行しています。
これは都合が悪いです。
私の使っているレンタルサーバーに大量の負荷がかかります。
場合によっては、サーバーの会社から私が怒られてしまうかもしれません。

しかも、翻訳に時間がかかります。
上記の文章を日本語に翻訳するのに約5秒~6秒かかりました。

それに対して「thai2english.com」は同じ文章を訳すのに2秒以内で結果が返ってきました。
どうやって辞書データとマッチングしているのか不明ですが、何となくデータべースを使っているわけではないような気がします。

これがマイサーバーなら、ASP.NETやJavaのサービス起動時にメモリー上に辞書ファイルを全部常駐させて置けるのですが、レンタルサーバーではそうはいきません。
使える言語はPHPかPerlくらいです。

そんなわけで今回の結論です。

 ・PDICタイ語は非常に優秀
 ・タイ語を知らない人でも何となく意味が掴める
 ・データベースに辞書データを入れておくと作りが簡単だけど処理に時間がかかる
 ・「辞書データ」を別にしても「thai2english.com」と同レベルのものを作るのはとても疲れる

残念ながらPDICタイ語のデータを勝手に公開するわけには行かないので、自分一人でこっそり翻訳して遊ぶくらいしか使い道がないのですが・・・。







ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ語の機械翻訳について、その2。

現時点で、唯一のタイ語翻訳サイト

 ・thai2english.com

ですが、どの程度の実力を持っているのか使ってみました。
翻訳に使ったのは
「クルンテープトゥラキット新聞」のWebサイト。

 ・オイルの値段が下がった記事

を翻訳してみました。

翻訳対象のページ。

oil.jpg






























これが、翻訳結果。

result_tran.jpg










































かなりの確率で訳してくれます。
英語訳はタイ語の単語にマウスカーソルを合わせることで表示される仕組み。
(上記ではราคาにマウスカーソルを合わせているところ)

翻訳できなかった単語についても、ちゃんと発音記号を載せていますね。


ところで、なんでも自分で作ってみたい私は

 ・タイ語 → 日本語

のなんちゃって翻訳サービスを実験したくなりました。





ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ語の機械翻訳について以前から気になってました。
英語やら中国語、韓国語なんかはフリーの機械翻訳サイトがいくらでもあるのに、なぜタイ語の機械翻訳サイトってないんだろう?ってのがずっと疑問だったのです。

"Japanese2Thai.com"というサイトがありますが、これも
 ・日本語→タイ語
の翻訳のみ。しかも、機械翻訳なのでかなり怪しいタイ語が出てきます。需要があるんでしょうか?

需要が多いのはやはり

 ・タイ語→日本語

の機械翻訳だと思うのですが、これをやってくれるサイトは私の知る限り1つしかありません。

 ・thai2english.com

これです。
残念ながら日本語には翻訳してくれませんが

 ・タイ語→英語

を翻訳してくれます。
翻訳と言っても、英語っぽい文章に直してくれるわけではなく、タイ語の文章を単語に分割して各タイ語にマウスカーソルを合わせるとその単語の意味が表示される仕組みです。

それだけといえばそれだけですが、正直このサイトはかなり優秀です。
なぜならこんな優秀な点があります。

 ・登録された語彙数が多い
 ・処理が早い
 ・単語の切れ目を結構正確に見極めてくれる
 ・発音記号が表示される

そもそも、タイ語の文章を翻訳するのは英語を翻訳するよりも敷居がずっと高いのです。
英語なら単語と単語の間がスペースで切れてるのでどれが1つの単語なのか明らかですが、タイ語は単語の切れ目がありません。

タイ語の文章を機械翻訳するためには大雑把に言って2つの機能が必要です。

 1.文章の中から単語と単語の切れ目を探す
 2.大量の辞書データの中から訳を探す

タイ語の文章で特に難しのは1です。
単語と単語の切れ目を探すのが非常に難しいのです。

タイ語というのは基本的に

 ・「子音」+「母音」
 ・「子音」+「母音」+「末子音」

の組み合わせで構成されています。
この「末子音」というのが曲者で、文章になっているとその子音が「末子音」なのか、次の単語の頭の子音(「頭子音」)なのか判断に迷うこともしばしばです。
これを機械的に判断させるのはなかなか困難です。

タイ文字が最速で読める講座にも書きましたが、タイ文字というのは読み方が1つに決まらない場合も多いです。文章になっていれば尚更1つに決まらない場合が多くなります。
例外パターンもたくさんあります。

にも関わらず、このthai2english.comはかなり正確に単語を切ってくれます。
仮に辞書データに登録されていない単語でも、発音記号を表示してきます。それもかなり正確です。


そんなわけで、単語と単語の間を機械的に切るのが難しいタイ文字文章ですが、それを補ってくれるのが2の「辞書データ」です。

例えば「いつも」を意味するเสมอ(サムー)ですが、辞書データ無しで単語を区切ろうとすると2パターンあります。

 ・เส(セー)と มอ(モー)で2つの単語
 ・เสมอ(サムー) で1つの単語

たぶん機械的に切っていくと「セー」と「モー」の2つに切ってしまいます。
ここで単語を正確に切る助けをしてくれるのが「辞書データ」です。

仮に「セー」と「モー」で切ってみます。辞書データで意味を調べます。そんな単語はありません。
辞書データで「サムー」を調べます。ありました。従って「サムー」であるとわかります。

大量の辞書データがあれば、かなり正確に単語を区切れることがわかります。





ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
タイ文字が最速で読める講座、を作っています。
長いこと、タイ文字を読むためのルールを延々と説明してみましたが、ようやく(あと1ページを残して)完成しました。

結局30ページ以上の大作になってしまいました。
読むほうも疲れると思いますが、書く方も疲れました。

この講座を書いてみてつくづく思ったのは
「タイ語は会話を先に覚えるのが良いか、文字を先に覚えるのが良いか」
という質問の答えがはっきり見えたなぁ、ということです。

その答えとは
「タイ語は会話が先、その後にタイ文字を覚える」
というのが通常のやり方だと思いました。

これが英語であれば、アルファベットが「abc・・・z」と26個しかないので、1日で覚えられます。
しかも覚えたアルファベットですぐ英語が読めます。
英語は「アルファベットが先」なのは明らかです。

でも、タイ文字はタイ文字のアルファベット(子音)が44個ですがこれだけ覚えてもすぐに使えません。
母音もたくさんあります。
じゃあ、子音と母音を覚えたらタイ文字がすぐ読めるかと言われれば読めません。

読めないというのは、「正確に読めない」という意味です。
つまり、「声調を一切無視」すれば、そこそこ読めます。
でも、タイ人には通じません。

タイ語では声調が非常に重要です。
声調を意識して「正確にタイ文字を」読もうとすると、めちゃくちゃ疲れます。

タイ文字の子音には字類というやっかいなシステムがあって42の子音(2つの子音は現在では使わない)が必ず3つの字類のどこかに属しています。

タイ語の声調をきめる要素は幾つかあって

 ・その子音がどの字類(高字類、中字類、低字類)に属しているか
 ・短母音なのか、長母音なのか
 ・末子音があるのか、末子音がないのか
 ・末子音があるなら「-k,-p.-t」で終わっているのか、それ以外の音で終わっているのか

少なくともこれだけの要素が全部頭に入ってないと正確に読めません。
さらに、単語によって母音の形が変わったり、単語によっては母音がまったく見えなかったりします。

その上、タイ語というのは単語と単語の切れ目がないので、何処までが1つの単語なのか見極めるのが意外に難しかったりします。

従ってタイ文字で単語1つ読むにも考えることが満載で非常に疲れます。
さらにタイ文字は構成上読み方が1つに決まらない場合があって、それらの単語は発音をあらかじめ知ってないと正確に読めません。

じゃあ、何でタイ人は誰でもタイ文字がすらすら読めるのか?タイ人は全員天才?

それはタイ人は最初からその単語の発音を知っているからです。
タイ人は最初から会話レベル100%です。
従って難しいことを考えなくても、タイ文字を見れば自分の知っている発音で読めば済みます。

個人的な意見では、タイ文字というのは自分の知らない単語を読むのはなかなか難しい、と思います。
特にタイ文字を習い始めの頃は。

そう考えるとタイ語というのはやはり「最初に会話の学習ありき」だなぁ、と思います。
少なくとも、たどたどしくても日常会話がなんとなくわかる程度のタイ語会話を身につけてからでないと、タイ文字を読むのが難しいと感じます。

1つの文章のを読むとき、全体の3割の単語が知らないけど、残り7割は知っている、というのであれば読むのが楽だし、全体の文章も比較的早く読めます。

でも、逆に7割の単語がわからないと、そもそも単語がどこで切れているのか把握するだけで疲れます。結果的に読解力の向上もたどたどしいかもしれません。

理想は、ある程度日常会話を覚えたらタイ文字と会話を同時に勉強することです。
なぜなら、タイ文字を読むとき声調が異常に気になります。なまじルールが複雑なだけ、声調を気にせずにいられません。

すると、結果的に日常の会話でも声調が気になりだします。
声調に気が回るようになると、発音も良くなります。

仮にタイ文字をすらすら読めるようにならなかったとしても、会話のスキルが上がると思うのです。






ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る
Flashでタイ語テストをするページがあるのですが(この辺とか)、テストが終わった後、正解率が表示されます。


 正解率100%:タイ語レベル「ドリアン」
 正解率80~:タイ語レベル「マンゴスチン」
 正解率60~:タイ語レベル「マンゴー」
 正解率40~:タイ語レベル「パパイヤ」
 正解率20~:タイ語レベル「パイナップル」
 正解率1~:タイ語レベル「ココナッツ」
 正解率0:タイ語レベル「バナナ」

こんな感じです。

実は開発当初から(もう9か月も前の話ですが・・・)、この正解率のログを取っていて、結果をFlashで表示したいなっとずっと思ってたんですが、実現方法がわからなくて放置状態だったのですが、ここにきて実現方法が見つかったので、作ってみました。

chart1.jpg




















chart2.jpg




















こんな感じで正解率が表示されるのですが、皆さん正解率が高い!です。
タイ語レベル「ドリアン」って正答率100%なので、1問でも間違えるとドリアンになりません。
でも、30%~40%くらいの人が正答率100%です。(カテゴリによって違いますが)

しかも、「あいさつ」カテゴリなんてもう500人くらいテストしてくれてます。
ちなみにブログパーツの「今日のタイ語テスト」の結果もこのグラフに反映される仕組みです。



ブログランキングに参加しています

にほんブログ村 外国語ブログ タイ語へ
タイ・ブログランキング
にほんブログ村 海外生活ブログ タイ情報へ

「タイリンガル」本サイトへ戻る

このアーカイブについて

このページには、2008年10月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2008年9月です。

次のアーカイブは2008年11月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。