スポンサーサイト 

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

機械翻訳を試してみると 

最近、英語のwebページなどで、"Babel Fish"という自動翻訳機能をよくみかけるようになりました。サーチエンジンでも「このページを翻訳する」というオプションがついていますね。

私は以前より、将来的には自動翻訳や自動通訳機能がかなり実用的になるだろうと考えていました(特に定型的文章において)。

6、7年ほど前に仕事でスペイン語の文書をざっと読む必要があって、ネットから20米ドル程度の最も安い自動翻訳をダウンロードして英訳に使ってみたことがあります。おかしな英文や意味不明のところも相当ありましたが、それでも6割~7割ぐらい、およその内容は掴むことができました。

しかしこれは類似系統の言語だからであって、日本語・英語といったまったく異なる体系の言語間では、実用的になるのは相当先のことだろうと思っておりました。

と、今月の「日経サイエンス」に「ここまできた機械翻訳(*)」という記事がありました。それによりますと、
1)これまでの、文法・構文・意味に関する「規則」から翻訳する技術に対し、
2)最近では膨大な量の翻訳済の文章から、「統計的」に適切な訳を選択する解析手法によるシステムが開発・研究されているとのこと。

私が思うに、これはコンピューターのCPU高速化とメモリー大容量化により可能になった手法のように思います。そして、直感的にはこの「統計的解析手法」の方が自動翻訳手法としては優れていると思われます。

*原文はこちらですが、残念subscribeしていないので、冒頭ちらっとしか読めませんでした。
"The Elusive Goal of Machine Translation", Scientific American, March 2006

さて、では、とりあえず「規則による翻訳」を主眼としたシステム(Systran)を試してみましょう。アルタビスタのBabel Fishに、英語のニュースを翻訳してもらいました。


原文
QUOTE
Amazon in Talks for Movie
15 March 2006

Specialty Retail industry news provided by Financial News USA (OTC: FNWU) Online retailer Amazon.com Inc (Nasdaq:AMZN) is holding talks with three Hollywood studios on creating a service to allow consumers to download movies and television programs and copy them onto DVDs, the New York Times reported on Friday. Citing three people briefed on the discussions, the Times said Amazon is in advanced negotiations with Paramount Pictures, Universal Studios and Warner Brothers.
UNQUOTE

すると、

Translation by Babel Fish
映画2006 年3 月15 日のための話のアマゾン ファイナンシャル・ニュース米国(OTC によって提供される専門の小売業界のニュース: FNWU) 消費者を映画及びテレビプログラムをダウンロードし、DVDs に、金曜日に報告されるニューヨーク・タイムズコピーすることを許可するようにオンライン小売商Amazon.com 株式会社(Nasdaq:AMZN) はサービスの作成のハリウッドの3 つのスタジオとの保有物の話である。議論で報告される3 人を引用して時によって言われるアマゾンはParamount Pictures 、普遍的なスタジオおよびワーナーの兄弟との高度交渉にある。
End of Translation by Babel Fish

がんばれBabel Fish!もう少しがんばれば何となく意味が通じるようになるよ(笑)!

素人からすると、英文の大文字は固有名詞だっていうことを認識させるのはそんなに難しいことではないように思うのですが、Times(ここではその前のNY Timesを指す)は「時によって」、Universal Studioは「普遍的なスタジオ」、ワーナー・ブラザーズは「ワーナーの兄弟」になってしまっていますね。ちなみに原文の"OTC"はover the counter=店頭市場で、"Financial News USA"という会社にかかります(取引市場と株式銘柄を示している)。

ということでまだちょっと厳しそうですが、冒頭に述べたように翻訳データベースによる「統計的解析」手法の方が拡がれば、たとえばマニュアルや解説書といった定型的文章の自動翻訳がそれなりに実用的になるのは、さほど遠い将来ではないように思います。

ただ、文学やドラマ、特にジョークやコメディは難しいと思います。

アルタビスタのweb siteで、マーク・トゥエインの文章の自動翻訳を試してみて下さい。抱腹絶倒。こんなことで笑っている私って、ほんとヒマ人って感じですね。実はそうでもないんですけど、笑いは健康によいので。

Feel free to try out this feature on a short story by Mark Twain.

文学でそれなりの質の自動翻訳ができるようになるのは、はるかに遠い将来のことでしょう。

(マーク・トゥエインの文章も仰天の日本語になりますが、サイト自体の"Close this Window"が「この窓を閉めなさい」になっているのも笑えます。Systranも昔の手法にこだわっていないで、はやく統計的解析手法を「使いなさい」。)

この記事はいかがでしたか。おもしろかった、まぁまぁおもしろかったという方は、応援のクリックをして頂けると励みになります。
にほんブログ村 英会話ブログへ←英語学習人気ブログをみる
ブログランキング←各種人気ブログをみる
英語音声Blogランキング←英語音声Blogをみる


関連カテゴリー: | 雑記 | → カテゴリー欄から同じカテゴリーの記事を探す

スポンサーサイト

コメント

機械が人を超えられるか!?

よくGoogleの検索結果に「このページを訳す」というのがありますよね。あれで訳してみて、全く意味不明でびっくりしたことがあります。「おぉ、私の訳の方がまだましじゃないか」って自信がつきますよね(笑)。
私も不思議に思っていたのですが、固有名詞が「ワーナーの兄弟」みたいになるってよくありますよね。大文字なのに。どうしてなんでしょうねぇ。

「統計的解析」というのは確かに威力がありそうです。結局人間も、前後の文脈や使っている単語のカテゴリーから、それが何の話題か、を掴んでいるということがありますよね。動詞と目的語の組み合わせから意味を統計的に判断する、というのが正しい方向なんだと思います。(あ、何か私、勘違いしてたら言って下さい。)

私はスムーズな機械翻訳は当分は不可能だろうと思っていたのですが、定型的文章なら結構いけそうですね。文学やドラマにはやはりそれを理解する「心」や「感情」が必要なのかな?

こんにちわ!

そうなんですよね。人も、単語の意味の中からその文脈に適切なものを選んで、あてはめて、理解する、という「統計的データ解析」を無意識に瞬間的に行っているんですよね。

だから、翻訳データベースが拡大し、かつコンピューターの機能が向上すれば、理論的には、質において人と同じレベルになるのはもちろん、スピードで圧倒的に人を超えられるようになると思うんです(瞬間ですものね)。

私の感覚からすると、自動翻訳がまだ今回のバベルフィッシュのレベルにあるのは不思議。固有名詞さえデータベース化してしっかり訳せれば、かなり意味は通じますよね。無料翻訳だからなのかな。

究極の世界はスタートレック。またスタトレネタですが(笑)。宇宙どこへ行ってもuniversal translatorで意思疎通ができるような。

なぜかデルタ宇宙域のまったく未知の言語に出会っても、ちゃんと訳されるのは、何百万種類という言語データベースを持っているから、類似の言語体系から類推して、訳される、、、ってことかな?

24世紀には、少なくとも地球上の主要言語はデータベース化されてuniversal translatorになっていると思います。

コメントの投稿















管理者にだけ表示を許可する

トラックバック

この記事のトラックバックURL
http://englishbynatsuno.blog62.fc2.com/tb.php/74-588fe318

機械翻訳機械翻訳(きかいほんやく)とは、ある自然言語を別の自然言語へ機械的に変換する技術をいう。例として、英語の文章を入力するとそれを翻訳した日本語の文章を出力する英和翻訳ソフトウエアなどがある。自動翻訳ともいう。.wikilis{font-size:10px;color:#666666;}Q

  • [2007/07/27 10:55]
  • URL |
  • 英語学習教習所 |
  • TOP ▲
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。