機械翻訳の質が良くなった。

もう翻訳は機械で良いのではないか。

そんな声が、ときどき聞かれます。本当でしょうか。

機械翻訳を売っている会社は「機械翻訳は優れている」と言いますし、人力で翻訳をする会社(や個人翻訳者の方)は、ああいうものは使うべきではないと言います。それぞれにそれぞれの利害や価値観があって、話はますます複雑になるばかり。でも実際のところどうなのでしょうか。

注) 翻訳というのは何も英語と日本語だけの話ではありませんが、ここでは英語から日本語への翻訳を想定しています。言語が変わっても大まかな傾向は同じであると思われますが、念のためご注意ください。 

機械翻訳のメリット・デメリット

弊社もときおり、機械翻訳が絡んだ案件を受注することがあります。機械翻訳が出力した訳文に編集を加えて訳文を作る作業、いわゆるポストエディット(MTPE)です。最初に経験的な印象を書いてしまうと、昨今の機械翻訳は、過去のひどい機械翻訳よりは、確かに良くなっています。それゆえに、けっして使えないものではありません。ただ、その用途はきわめて限られるのではないかと思います。 

具体的な所見を箇条書きにすると以下のとおりです。 

 

一応の「訳文」ができるまでの期間はきわめて短い 

意味を理解する程度なら、読む人が読めばできる部分も少なくない(原文を正しく反映しているかどうかは別問題です 

  

たいていは、明らかに日本語になっていない箇所が残っている。場合によっては文が途切れている 

キーワードの訳、常体敬体などが文ごとにバラバラのことがある 

原文にあるはずの要素が(ときにゴソッと)抜けることがある 

「する」「しない」が原文と真逆になることも 

 

以上は、いわゆる「ニューラル機械翻訳」が登場し、機械翻訳の質が劇的に上がったとされる2016年頃から現在に至るまで、大きく変わっていません。技術的には改良・改善があったのかもしれませんが、現場感覚としては変化なしです。ですので、このあたりを踏まえて用途を考えていかなければなりません。 

 

どういう場面なら、機械翻訳の恩恵を受けることができるか

機械翻訳にまったくメリットがないわけではありません。ただ、そのメリットというのは、一般に考えられているよりも狭いのではないかと思われます。以下、この点を少し検討してみたいと思います。 

 

機械翻訳のメリット=「日本語の文字で書かれた文が、きわめて短期間で手に入る」

「それらしいものが短期間で手に入る」という点においては、機械翻訳が圧倒的に強いことは間違いないと思います。このスピードという点については、人力の翻訳では絶対に歯が立ちません。ただし、訳が正しいかどうかや、流暢かどうかを気にしないことが条件となります。たとえば、下記の日本文をご覧ください。 

 

第5条に基づく補償義務、本契約に基づいて付与される知的財産権の違反および/または所有権の違反を除き、第7条に基づいて付与される知的財産権および/または財産権の違反、および第7条に基づいて付与される間接的、特別、付随的、例外的または懲罰的損害賠償(損失データ、逸失利益、逸失利益または代替商品もしくはサービスの取得費用を含むがこれらに限定されない)に対して、いずれの当事者も責任を負わない。 

 

「どちらの契約当事者も、間接損害や懲罰的損害賠償等については免責されるのだろう」「といっても、知的財産権の侵害など、例外もありそうだ」「その例外は、第5条(や7条?)を見るのだろう」くらいのことまではわかります。そのレベルのことがざっくりわかればいいという話であれば、機械翻訳も悪くないと言いうるかもしれません。 

※ちなみに、上記例は契約書の一般条項の一節です。契約書の一般条項は、入力としての対訳データの数が多いので、比較的良い訳文が得られやすい傾向にありそうです。翻って社内文書のようなベースとなるデータの少ない文書でどのくらいの水準の訳文が得られるかはわかりません。 

 では、もう少し詳しく、機械翻訳が機能しそうな局面の条件を考えてみましょう。 

 

(1)「訳文の質がさほど重要でない局面で」使用する

現状の機械翻訳では、キーワードの訳が一定していなかったり、原文の要素が(程度はともかく)抜け落ちたりすることがあるようです。また、「する」「しない」が逆になっていることもありました。対顧客の文書をはじめ、訳文の質が重要な文書を機械翻訳で済ますというのは、少なくともオススメできないということが言えるのではないでしょうか。 

 

(2)「読み慣れている種類の文書」に使用する

さきほど、 

      • 「どちらの契約当事者も、間接損害や懲罰的損害賠償等については免責されるのだろう」 
      • 「といっても、知的財産権の侵害など、例外もありそうだ」 
      • 「その例外は、第5条(や7条?)を見るのだろう」 

くらいのことまではわかりますと書きました。さらっと流してしまいましたが、このようなことがわかる前提として「英文契約書を読み慣れており、定型的な文言やその趣旨が頭に入っている」必要があることは、けっして無視できません。訳の質に多少の問題があっても、自分の頭の中で原文(英文)を再構成したり、知識を活用したりすることによって、内容を補完している側面があるわけです。機械翻訳の訳文を利用する方々にそのようなスキルが期待できないのであれば、費用に見合う効果は期待しにくくなるでしょう。 

 

(3)「ざっくりと大意を把握するために」使用する

(1)に挙げたような事情がありますので、用途は大意の把握にとどめるのが無難かもしれません。とはいえ、ひところの機械翻訳に比べれば内容を理解できる度合いは高まっていますので、契約内容の精査の前にざっくりと全体像を見たいときであるとか、ざっくりとした内容確認を目的とした用途であれば、使ってみるのも悪くないと思います。なんと言っても、自分の母語になっていると、読む際の抵抗感が全然違いますから。  

つまり、 

      • 訳文の質がさほど重要でない局面で 
      • 読み慣れた種類の文書の 
      • ざっくりと大意らしきものがほしい 

という程度なら、スピードを重視して機械翻訳で済ますという選択肢もあるのではないでしょうか。 

 では、一言で言うなら早さが強みの機械翻訳。その訳文の至らない部分を人間がカバーすれば、良いものが早くでき上がるのではないか、と思われる方もいらっしゃるかと思います。ここからは、その点について少し考えてみましょう。 

 

「機械翻訳の出力」から「プロの翻訳者と同等の成果物」は作れるか

結論から言うと、プロの翻訳者と同等の成果物を作るのは不可能ではありませんが、プロの翻訳者が最初から作業したのと同程度のコスト(時間なり金銭なり)がかかると思われます。なぜかというと、「訳文が原文の意味を正確に反映している」ことを担保するためには、少なくとも「原文と訳文を突き合わせる」作業が必要になるからです。「日本語だけ読んでちょっと修正すればそれなりの質の翻訳ができる」というようなイメージをされている方がいらっしゃるのなら、そのような認識は、少なくとも現状の機械翻訳を前提とするかぎり、間違っているといえると思います。この点について少し説明しましょう。 

 人力で英日翻訳をした場合の流れを簡単に書くと、 

 

(1)英文を読む 

(2)その意味を考える 

(3)しかるべき日本語で文を構築する 

 

くらいの感じになります。機械翻訳が介在すると、これが 

 

(1)英文を読む 

(2)その意味を考える 

(3)現在の機械翻訳の出力を読む 

(4)その意味を考える 

(5)英文と機械翻訳とで言っていることが違っていれば、あるいは、一応正しいと言えても自然な日本語になっていなければ、しかるべき日本語で文を構築しなおす 

 

というフローに変わります。機械翻訳の日本語を解読するプロセスが余分に加わるのです。 

機械翻訳の結果の解読に手間取るようなら、機械翻訳の出力を無視する方がプロセスが減るので、労力も時間も少なく済ますことができます。しかし、それはすなわち、(3)と(4)のプロセスを削ることにほかなりませんので、普通に自分で翻訳するのと変わりません。仮に機械翻訳の出力の解読自体が簡単でも、「原文の英語の意味を反映した自然な日本語かどうか」を検討しようと思ったら、頭の中に「原文の英語の意味を反映した自然な日本語」を構築する必要があります。これも、(文字に書き起こしていないだけで)自分で翻訳するのと変わりません。いずれにしても、機械翻訳の出力を解読する時間がかかる分、余分な労力がかかるわけです。納期、費用、品質のいずれかにしわ寄せがいくことは避けられないでしょう。 

 

結びに代えてたとえ話を

ちょっとお高いお寿司屋さんに、お客さんがやってきました。そのお客さんがこう言ったらどうでしょうか。「大将、今日は炊飯器で炊いた米を持ってきたから○割引で頼むよ」と。首尾よくつまみ出されなかったとします。大将は、客が持ってきたシャリをどうにかこうにかして寿司を握ります。でも、どうしても自分の味を再現できない。客はどうも不満げです。大将としては、いっそ、客の用意してきたシャリを無視してしまった方が早い。でも、そうすると、お客さんの言う○割引の正当性はどうでしょうか。 

あるいは、プログラマーの方であれば、何かコードを自動生成してくれるソフトウェアがあるとしましょう。そのコードのうち数割を修正すれば目的のプログラムが完成するという触れ込みなのですが、その数割の要修正箇所がどこにあるかはわからない。その場合、自分でコードを書くのとどちらが早いでしょうか。 

機械翻訳のポストエディットで「プロの翻訳者と同等の成果物」を得ようという試みは、今のところこういう話に近い気がします。 

現状の機械翻訳は、翻訳の補助ツールではありません。逐一原文に立ち返ることを求める限りは、普通に翻訳をするのとほぼ同じ労力が求められてしまうからです。あくまでも、「質はともかく日本語の文字で書かれた文を、ごく短期間で入手したい」時に活用するのが、正しい使い方なのではないでしょうか。