Deep Learningは機械翻訳の夢を見るか?

「高度に発達」とか,曖昧な定性的表現とか使うなよ.

どのくらい高度なのか.それは実用レベルの機械翻訳になるのか.まずはそこからだ.

人工知能が完璧に自動翻訳をできるようになるまで、あと何年くらいかかるでしょうか?」
僕は直感的に答えました。
「まあまだまだ、あと五年か十年はかかるでしょうね」

論理的技術的科学的に答えろよ...アホか.

結論からいえば,いつ実用になるのか全く見当も付かないレベル.それが実用化されたとしても,いつでもどこでも利用できるポータブル機器が安価に普及するには,その後何十年もかかるかもしれない.今産まれた子供が英語を学ぶ必用の有無については議論の余地はあるが,仮にそれが不要だとしてもその理由は「機械翻訳が実用化されるから」では断じてない.*1


ここで言ってる人工知能ってさ,要するにDeep Learningを使ったニューラルネットのことだと思うけど,たしかにAlphaGoみたいに今まで不可能だったことを可能にしたのは衝撃的な事件だった.それは快挙と言って良い.

だが囲碁はチェスやオセロのようなゲームプログラミングの中ではコンピュータにとって「最も難しいモノ」だったとは言え,限られたルールブック内の知識だけで処理できるという意味では比較的「簡単なモノ」でもあったのだ.

たとえば囲碁では勝敗が明確に定義できる.これに対して「良い翻訳」というのは定義できない.「この翻訳機は翻訳力たったの5か...ゴミめ」とはならんのだ.だから教師無し学習は無理だろ.


問題の一つは常識の無さだ.これは「未来の二つの顔」の頃には既に広く知られていた.


golden fluffy pancakesの作り方.

  1. 小麦粉を入れる
  2. 牛乳を入れる
  3. 卵を入れる
  4. よくかき混ぜる

ショート・サーキット HDニューマスター・エディション[DVD]

だいたいあってる.


あなたには,ジョニー5が何を間違えたか分かるだろうか?「常識」がないとこういうことも起きてしまう.そしてそれを防ぐのは非常に難しい.

未来の二つの顔 (創元SF文庫)

未来の二つの顔 (創元SF文庫)

Cyber Rogues (English Edition)

Cyber Rogues (English Edition)

「でもあなたは卵を壊してはならないと言った」
「料理をしようとする時には,卵を壊してもいいんだ」ロンは冷静さを取り戻して言った.ヘクターは直ちにフライパンから卵を取り,手の中で潰すと,それを前につき出して,できあがった汚らしいものをフライパンの中に滴らせた.ローラは顔をしかめ,思わず嫌悪の叫びを上げた.

「これでわたしのいおうとしたことがわかったろう」とダイアーが論評した.「完全に合理的な解決だが,常識による抑制が全くない」

「さあ,FISE,もう一度やってみよう」とロンが言っていた.「忘れるなよ,自分が食べる卵の中身に殻の破片が入ってはまずいんだ.わかったか.おまえは,殻は屑入れに,卵の中身はフライパンに入るようにするにはどうすればいいかを,考えればいいんだ.いいか?」

Deep Learningの実力と限界、人工知能のロードマップ」

The trophy doesn't fit in the brown suitcase because it is too big/small.
What is too big/small?

質問内容は驚くほど簡単だ。上の写真がその事例で、「トロフィーが大きすぎるので、カバンに入らなかった。何が大きすぎたのか。」という質問。この問いはコンピューターにとって難問となる。質問は特殊な構造をしており、言葉の順序など、統計情報から回答できないように工夫されている。対象物が二つ (トロフィーとカバン) 登場し、それが代名詞 (IT) で結ばれる。質問に回答するために、コンピューターは知識と常識に基づく判断が求められる。

http://ventureclef.com/blog2/?p=2827

問題分野に対する知識や常識がなく、統計的に処理している限りは,こんな簡単な文章さえ理解できないのだ.いまのままでは度々省略を受ける自然言語を解析し,理解し,適切な文章を「創作」する作業である翻訳が,一朝一夕に実現できるとはとうてい思えない.

“Could you please go shopping for me and buy one carton of milk, and if they have eggs, get 6!
ある妻がプログラマの夫に「買い物にいって牛乳を1つ買ってきてちょうだい。卵があったら6つお願い」と言った。

A short time later the husband comes back with 6 cartons of milk.
夫はしばらくして、牛乳を6パック買ってきた。

http://dailynewsagency.com/2011/02/16/programmer_joke/

このジョークも同様な問題をはらんでる.*2 *3


日本語と英語間だけでも,

  • 時制の違い.現在完了形の有無.
  • 日本語では単数/複数の概念が希薄で,度々省略される.英訳の場合は文脈を理解して随時補完する必用がある.
  • 逆にbrotherと兄/弟みたいな場合は和訳のたびに文脈で補完する必用がある.場合によっては作者に問い合わせる必用さえ出るかもしれない.
  • 食べ物や家の作りなど,文化の違いを考慮する必用も多い.

程度だけでも,けっこう難問だと思う.少なくとも統計的に処理できる範囲を超えてるのは.

けっきょくその手の方法でなんとかなるのは「ください 一個 パン」とか「お湯 出ない 治せ」レベルだろう.もちろん日英以外の無数の言語にも対応してくれれば,「ないよりはマシ」で日本語はおろか英語も話せない客をとる宿泊施設などでは重宝するだろうが,しょせんはその程度だ.

つまり、画像を言葉にできるとき、言葉を画像に変換することもできます。

世の中には画像で表現することが難しいものは多々ある.無を表現する数学記号「0」の発明なんかその一つではないか.*4

数学記号なんか,抽象概念のオンパレードじゃない?「=」や「>」一つとってみても,いったいどうやって画像に変換するのか.

簡単じゃないから,こういうゲームも存在すると.

AIで一度画像に変換してから画像を説明させるという方法を使うと意図的なウソをつかなくても、「勘違い」を起こすことで結果的には意味がそれほど変わらないエラーが自然に入ることになります。

好意的に解釈しても,理解した気にはなってるが,正確には伝わらない.「イライザはチューリングテストをクリアした人工知能だ」レベルの話だ.

ちなみに英語教育ドップリのお人は、つい「A man is typying "a" keyboard of note PC」のように「aが抜けてる!」とヒステリックに叫びますが、ここではあんまり意味のある話ではありません。

それはたまたま運が良かっただけ.

上のショートサーキットの例でも,卵はeggsで複数だ.もしan eggと単数だったら,「複数用意した卵のうち卵を一個を入れろ,(残りは後で入れる)」という意味にしか取れない.逆にたとえば「妻は家で待ってます」を翻訳した時に,意味もなく妻を複数にしたら大問題だ.*5

単数/複数や定冠詞や不定冠詞の有無で,意味がガラリと変わるのはそんなに珍しくない.実用レベルの機械翻訳を目指すなら,それは無視するわけにはいかない.

実践 日本人の英語 (岩波新書)

実践 日本人の英語 (岩波新書)

(3章が「恋人は何人 ー 冠詞と数」で,まるまるそういう話にあてられてる)

下記の英文は.「新宿駅のどのキオスクもコーヒーと新聞を販売している」を英語に直したものである.下線部のうち,間違いを一つ指摘し,訂正しなさい

Every(1) kiosk in(2) Shinjuku Station sells(3) coffee and newspaper(4).

さて,読者の皆さんは正解がおわかりだろうか?

「この先しばらくは,月曜日か火曜日なら,たいてい都合がつく」ということで,次のような英文で相手の都合を聞く.

How about getting together on Monday or Tuesday?

これは,表面的には何の問題も無さそうな英語であろう.しかし,逆の場合,つまり英語圏人が同じ事を訊く場合,on Monday or Tuesdayとは書かない.というのも,これだと「この先しばらくの間の月曜日か火曜日はどうですか」という意味ではなく,「今度の月曜日か火曜日はどうですか」という意味になり,本来の意図とは異なる意味がはっきりと表現されている英文になってしまうからだ.

たとえば,「彼女はよく大学時代の恋人を思い出す」と英語で言いたいとしよう.日本語では誤解のしようがない文に見えるが,実は,これだけでは英語には訳せない.
この日本語は,

  1. 「大学時代の彼女の恋人」が一人しかいない場合
  2. 「大学時代の彼女の恋人」が複数いて,そのすべてをよく思い出す場合
  3. 「大学時代の彼女の恋人」が複数いて,そのうちの何人かをよく思い出す場合
  4. 「大学時代の彼女の恋人」が複数いて,そのうちの一人をよく思い出す場合

という四つの場合を同時に含んでいるからである.

日本語表現ではどの場合であるかは曖昧のままでいいのだが,英語では逆に,曖昧な表現にしたくても,そもそもできない.英語では,それぞれの場合において表現が変わってくるし,「複数の場合」を同時に含む英語表現がないのである.

初心者はあんまり気にせずに喋れと言われるけど,間違いは間違いだ.


その英語、たった1字の違いなのに意味が逆 その英語、ネイティブにはこう聞こえます

http://b.hatena.ne.jp/entry/d.hatena.ne.jp/shi3z/20161011/1476129642

  • id:Murakami 翻訳は文脈を理解しないといけないので、ここに書いてあるとおりには行かないでしょう。法隆寺はすごい人だ」が法隆寺さんという人について言っているのか、お寺の人混みについて言っているのか、それが文脈です。
  • id:Sinraptor AIに夢見すぎだろ。AIはいまだに文章の意味を理解してはいない。文法や大量の翻訳パターンから訳を導き出しているが、意味を理解せずに翻訳しても完全な翻訳にはなりえないし、タイムラグの問題は永遠に消えない。
  • id:gowithyou 正確に翻訳するためには、世にあまねくコンテキストを理解してなければならないけど、それってシンギュラリティに到達しないと成し得ないと思う。自分が生きてるうちに成し得ないと思うので、英語の勉強は続ける。
  • id:kei_1010 5年後にまた読む。 たぶん今のGoogle翻訳と精度はあまり変わっておらず「英語を学ぶ必要は今後もありそう」という感じになってると俺は予想しておく。 強いAIを作るのに匹敵するレベルの難易度だと思ってる。

「それは奈良観光協会が既に通った道だ」的な話がチラホラ. http://d.hatena.ne.jp/JavaBlack/20120527/p1

Dragon Kingは誤訳ではないが,名訳でもないか.御手洗さんとか,どう訳されるんだろう.

「亡霊は今も日本の空を飛んでいる」とか*6,「ジョン・F・ケネディの最後はどうなりましたか」*7とかもありだな.

  • id:shields-pikes ある能力がほぼ不要になる(またはコモディティー化してして職能として認められなくなる)ようなイノベーションが起こる直前は、その能力のニーズが最大化してたりするので、分野単位のニーズは先読みを誤りやすい。

同意.

翻訳器により国際的な取引が今よりも拡大してるのに安価なポータブル同時通訳機が普及するまでの間は,直接会話するスキルは今まで以上に必用とされるだろう.


あとで読む.

  • id:nakakzs 電卓と九九を思いついて書こうと持ったらすでにあった。|つか完全に理解できないとウイルスとかでAIが誤報出してもそれを暴けずそのまま進むというSF的展開になるような。
  • id:practicalscheme はるか未来でも、電卓があっても九九や概算は出来た方がいい、程度には必要性は残るでしょう。自分の言語を相対化する(「考え」と「それを記述する言葉」を区別する)のに外国語学習は効果的。
  • id:pero_pero 小学生の頃にワープロが出てきて「漢字の自動変換の時代が来るので漢字は読めればよい」と自信を持って漢字を勉強しなかった僕は、今漢字がかけなくてとても恥ずかしいです
  • id:imakita_corp goggle翻訳が20年前のパソコンに付いていた翻訳ソフトレベルのままな上に段々とクルクルパーになっていくのでもう語学は気合と根性でやり直すしかないと脳筋の俺は決心したんや。欧語同士はもっと発展するやろうけど
  • id:rjj 10年ほど前Googleが飛ぶ鳥落とす勢いだった頃「検索エンジンが発達してこれからは専門家なんて不要」と言ってた人たちがいたのを思い出した。そう言う人たちが増えるほど逆に専門家の必要性は増すだろうなとは思った。

「英語が読めるようになるには英語を読むしかないが『日本人の英語』シリーズは読む価値あると思う」

http://watto.hatenablog.com/entry/2016/10/13/003000
ついでにメモ.
日本人の英語 (岩波新書) 続 日本人の英語 (岩波新書) 実践 日本人の英語 (岩波新書)

http://b.hatena.ne.jp/entry/watto.hatenablog.com/entry/2016/10/13/003000
  • id:ustar 制限用法は「私はシカゴに住んでる方の姉を訪ねた」と訳すとわりと納得する あと会話だと非制限用法のwhoは略す?

なるほど.

「上の方の兄貴」「一人目の妻」「第一次世界大戦」みたいな感じか.こういう書き方をすれば,普通は上の兄貴以外にも兄貴がいるもんだと暗に仮定する.*8


  • id:ssids 個人的にはカンマが入るとその後に見えない「a.k.a.(also known as)」が入ってる気持ちで読んでる。そうすれば一人しか居ない、ということが何となく伝わってくる
  • id:charliecgo 読むとき、カンマで一息置くと意味の違いがが分かる。それでもわからなかったら、カンマの後に「すなわち、」みたいな語を頭の中で念じればよい。
  • id:mawhata my friendだと「私の(一人しかいない)友達」になって、a friend of mineだと「私の(何人かいる)友達(の一人)」という意味合いになると教えてくれたのも『日本人の英語』だったかな。学校では全く教えてくれなかった。
  • id:shinonomen 「刑事は血まみれになって逃げる犯人を追いかけた。」みたいな話でしょうか。シカゴの姉の話でも、姉が複数いるかが重要な情報である場合はもっと明快な書き方をすべきですよね。

前述した「彼女はよく大学時代の恋人を思い出す」みたいに,他にも翻訳の段階で「この文だけでは訳せない」例ってあると思う.それは人工知能がちょっとばかり発達した所で対応できるわけがない.

  • id:xga 制限用法みたいな伝統的な文法用語が分かりにくいっていうのはありますよね。形容詞の限定用法と叙述用法も、英語だとattributiveとpredicativeになって、修飾的用法と述語的用法と訳すほうが分かりやすくなるはず。
  • id:blue0002 読む価値ないとは言わないが、いま読むなら同氏による『実践ロイヤル英文法』を薦める。文法は部分的な用法より体系で学ぶのが大切だと思う。

表現のための実践ロイヤル英文法(音声DL付)

表現のための実践ロイヤル英文法(音声DL付)

あ,あれ同じ作者だったのか.両方持ってるのに,気づいてなかった...

  • id:rerittu 関係ない話ですが、センターレベルの英文を正しく読める人は人口の何%くらいなんだろうな、と思いました。

murawaki の雑記「ニューラル機械翻訳と記号幻想の死」

http://rekken.g.hatena.ne.jp/murawaki/20161017/p1
追記.

そうしたシステムをどうやって作るか。翻訳に必要な知識をどうやって計算機に教えるか。人間が翻訳規則を直接書いていた大昔ならいざしらず、現在は計算機自身に翻訳のための知識を獲得させる。そのために、源言語と目的言語の文ペアを大量に計算機に与える。日英や日中なら百万のオーダ。その大量の文ペアから、どういう入力に対してどういう出力をするかという対応を計算機が学習する。教師データと完全一致する文しか翻訳できないようでは困るので、ある程度汎化した形で対応を学習する。教師データから学習するので教師あり学習といえる。

凄いといえばすごい.たとえば,
世界一わかりやすい!一夜漬けインドネシア語―CD付き CD BOOK はじめてのヒンディー語 (アスカカルチャー) ひとり歩きのアラビア語自遊自在 会話集 トルコ (絵を見て話せるタビトモ会話)

みたいな文章サンプルを読み込ませて学習させれば,旅行会話用の各国語翻訳機がだいたいできてしまうというのだから.

源言語のテキストが表現しているものが、いままで人間が目的言語で表現したことないもので、翻訳に苦労することなんていくらでもあると思う。そんなものを機械翻訳が魔法のように翻訳してくれるわけがない。そんなことは期待されていない。実際、科学技術論文だけを与えて学習した中日翻訳システムは、「你好」すらまともに訳せない。

出力直前の処理は、ニューラル機械翻訳が犯す誤りを見るとよくわかる。例えば、英日翻訳で、「Tunisia」を「ノルウェー」と翻訳するといった不思議な間違いが生じる。チュニジア」も「ノルウェー」も地名としてテキスト中で同じように振る舞うから、連続空間上で近くに配置され、つい間違えてしまうのだろう。

しかし弱点もまた多そうな.たとえばそれこそ中学生レベルの文法も理解してないから,中学生でもやらなさそうな初歩的な文法ミスを頻発するとかありそう.*9

日英翻訳を例にとると、源言語の記号列「私 は 学生 です 。 」( は終了を表す特殊記号) と目的言語の途中までの記号列「I am a」を受け取ったとき、システムは次の出力記号として「student」を吐く (ことが期待される)。

あ,やっぱり日本語だと単語の区切りも検出できないんだ.文末も明記しないとだめっぽい.それでも,従来方式に比べたら労力は随分減るのだろうけど.

日英/英日翻訳すると,「一文」の長さが変わったり順序が変わったりもするから,そこがどうなるのかちょっと疑問.けっきょくデータを食わせる前に,全部人間が前処理してあげないと処理できないんじゃないかな.

*1:イヤホン型同時翻訳機「Pilot」は,絶対に見かけ倒しか詐欺だと思った.ところで,結局あれ出荷されたの? http://tabi-labo.com/262958/ear-translator/ http://getnews.jp/archives/1467526
技術的に実現不可能なので,見た瞬間に詐欺を疑われるという点ではJM-NET事件の同類. http://www.itmedia.co.jp/news/articles/0401/23/news023.html http://timesteps.net/archives/818597.html

*2:翻訳だけなら曖昧なままごまかせばいい時もあるけど,曖昧にごまかす翻訳テクニックって,実用化されてたっけ.また意味理解的には「牛乳1パックは何リットルか?」も問題だ.日本だと1Lと500cc,200ccなどがメジャーで,この文脈だと1Lの可能性が高いだろう.しかし米国だと2Lとか4Lみたいなもっとでかいのもあるらしい.これだけでは容量が曖昧なままになる.
同様に仮に卵を「6つ」買ってくるとしても,それは6個入りを一パック買ってくるという意味なのか.10個パック或いは6個パックを6パック買ってくると言う意味なのか.その辺は家族構成や卵の消費量,そして普段奥さんが買い物でどうしているかという,この家庭におけるローカルルールに依存するため人間でも分からない.
この意味理解に失敗すると,「言葉を画像に変換する」ことで翻訳する方式は破綻する.絵を描いて伝える伝言ゲームが成立するのもそのため.

*3:「卵1パックは何個入りか?」も国によって差違があるらしい. http://blog.livedoor.jp/fairypot2/archives/1593771.html , http://q.hatena.ne.jp/1149169469
6個と10個または12個が多いようだが,「私もフランスにいるけど、4,6,8,10,12,たしか18個でも売ってたよ。一番ポピュラーなのは6個入りだ。」という意見もある.「六つ」買ってくるとしても,それが6パックだった場合は36個なのか72個なのかは,その国と地域の常識で変わってきそうだ.1人暮らしで週に何回もスーパーに行くならまだしも,大家族で一日10個以上消費する家庭が一週間分まとめて購入するなら,72個というのはそんなに驚く個数ではなくなるし.こういう点でも,良い翻訳には(常識に裏付けられた)意味理解が必要不可欠になる.そしてこれはDeep Learningが苦手とする部分だ.

*4:「子供達が野球をしている」くらいなら書くのは簡単だけど,「甲子園準決勝、○○高校と△△高校の試合,バッターが送りバントに失敗しダブルプレーになって4回表の攻撃は終了」とかって,どうやって絵に描くの?「郵便ポスト」みたいなものでさえ,国や時代によってデザインが異なっていたりするし.

*5:一夫多妻の国で,本当に複数の妻を持ってる場合を除く.

*6:http://www.sankei.com/premium/news/150417/prm1504170002-n1.html

*7: https://ja.wikipedia.org/wiki/%E3%82%B8%E3%83%A7%E3%83%B3%E3%83%BBF%E3%83%BB%E3%82%B1%E3%83%8D%E3%83%87%E3%82%A3_(%E7%A9%BA%E6%AF%8D) https://ja.wikipedia.org/wiki/%E3%82%B8%E3%83%A7%E3%83%B3%E3%83%BBF%E3%83%BB%E3%82%B1%E3%83%8D%E3%83%87%E3%82%A3_(%E7%A9%BA%E6%AF%8D%E3%83%BB%E5%88%9D%E4%BB%A3)

*8:奈良の大仏」というのも考えてはみた.しかし「奈良の大仏」の場合は奈良以外にも大仏はあるけど,「パリのエッフェル塔」は一つしかなくてもこの書き方をして問題は無い.どちらかというと,非制限用法にあたるのかな?

*9:単位の変換とかも学習するのかな?たとえば話中では100フィートや100mphを使ってるけど,それじゃ日本人には分からないからそれぞれ30mや160km/hに変換して置き換えるみたいな.そこだけ前処理や後処理でやってもいいけど.