オライリーの「Hadoop」本発刊、翻訳者に裏話を聞きました

2010年2月17日

クラウド上で動作する大規模分散処理のプラットフォームとして注目が集まるHadoop。そもそもはグーグルが大規模な検索を行うためにMapReduceと呼ばれる処理を考案し、それを基にオープンソースとして開発されたのがHadoopです。現在ではYahoo!やFacebookが社内の大規模データ処理のために採用していることでも知られていますし、日本でも昨年「Hadoopユーザー会」が立ち上がりました。

オライリー・ジャパン刊「Hadoop」 Tom White著、玉川竜司・兼田聖士訳

そのHadoopに関する国内初の、そして決定版的な書籍「Hadoop」がオライリー・ジャパンから1月に発刊されました。そこでこのHadoop本の翻訳者の一人である玉川竜司さんに、翻訳の裏話や読みどころなどをメールでインタビューしました。

玉川さんの本職と、Hadoop本を翻訳をすることになった経緯を教えてください。

本職は会社勤めの開発者なんですが、昨年頭からSilverlightのユーザー会をやっていまして、そこで「翻訳をやろう」と盛り上がりまして......

で、個人的に興味のあったエンタープライズ系のSilverlightの本（Data-Driven Services with Silverlight 2）が米国のオライリーさんから出ているということで、アポなしでいきなり日本のオライリーさんに電話して「この本翻訳したいんですけど、いかがでしょう」と（笑）。

それがいろいろな意味でタイミングがよくて、ちょうど翻訳の企画が動いていたときに電話したのと、私がそれまでにマイクロソフトの方のブログの翻訳をボランティアでやっていて、それなりの質に達しているということでSilverlightの公式ページからもリンクしていただいていたので、とんとん拍子で話が進みました。

そして、その本「Silverlightで開発するデータ駆動アプリケーション」ができあがったあと、本来はSilverlightの別の本の翻訳をやるつもりだったんですが、その本が全然出版されないもので、オライリーさんから「こっちどうですか」と紹介されたのが、今回の原書になった「Hadoop The Definitive Guide」です。

Hadoopはいつ頃からご存じだったのですか？

技術者として分散処理や並列処理には興味がありましたし、Hadoopも名前だけは知っていましたが、本当に関わりを持ったのはこの翻訳がきっかけです。幸いなことにHadoopを構成している要素技術、JavaやLinuxやPythonなどに関しては元々知識があったので、わりとすんなりと入っていけました。

翻訳の進め方はどんな感じだったのでしょう。また翻訳には何カ月くらいかかりましたか？

翻訳の作業はある意味とても単調です。ページ数は決まっていますし、締め切りを決めてしまえば、あとは自動的に一日あたり何ページ、週当たり何ページ翻訳しなければならないといったペースは決まってしまいます。

翻訳がスタートしたのは確か2009年8月24日ですが、そこからざっと計算して、11月いっぱいほどで終わらせたいと思っていました。原書を読み始めてすぐに内容が非常にエキサイティングだと感じたので、とにかく早く出版して日本の技術者の皆さんに届けたいと思いまして、できれば10月中に訳了してしまいたかったんですが、さすがにそれはちょっと無理がありました。

結局、最終的に校正まで終わったのが12月半ばでしたから、翻訳自体は3カ月程度で終わらせたことになります。

翻訳はノートパソコン（VAIO TZ）でやっています。自宅で作業しているときは外部モニタをつないで2面にしていますが、喫茶店などでやることも多いです。原書のPDFを見ながらワードに訳文を書いていくんですが、1366×768の解像度だとどうにか両方を横に並べて作業できるんです。「Hadoop」を訳しはじめた頃にWindows 7が使えるようになって、Vistaに比べると作業効率が格段に上がったのには助けられました。

動作確認や技術的なチェックなどHadoopでは大変そうですが、どうされたのでしょうか？

Hadoopはクラスタで動作するソフトなんですが、当然自宅に何台もPCを並べておくわけにはいきません。そこで、Hyper-V Server 2008 R2を自宅サーバに入れまして、その上でLinuxのインスタンスを並べて動作確認しました。自宅サーバはAthlon 64をCPUとして搭載した自作機で、8GBメモリ、ハードディスク1TBです。5万円以下で組んだマシンですが、今回の用途には十分役立ちました。

日本語版にするにあたり原書から内容を変えたところはありますか？あるいは日本語版特有のトピックなどがあれば教えてください。

基本的に翻訳は裏方だと思っているので、できる限り読者の方には存在を意識していただかないように心がけています。

ただ前書きにも書いたんですが、定訳がまだない語が非常に多い本なので、そこをどうするかは最後まで迷っていました。Hadoopユーザー会のライトニングトークで「どちらがいいですか？」のプレゼンをしたときに、懇親会で酔っ払った皆さんが一斉に下を指さした光景が目に焼き付いています。妙な迫力のある光景でした（笑）。

翻訳者の玉川さんが、Hadoopユーザー会で質問をしたときのプレゼンテーション

個人的には、翻訳は「必要悪」のようなものだという思いがあります。日本の技術者が原書を読みこなせるだけの英語力を持ち、翻訳が不要になることが日本という国のためにも望ましいことだと思います。とはいえ、現実にはなかなかそれは難しいことなので、本書を通じてHadoopに興味を持っていただけたなら、今度はぜひ英語のドキュメントなどにも当たっていっていただければと思います。

翻訳者から見た本書の読みどころと、技術者としての読みどころを教えてください。

個人的には、昔いわゆる「Perl本」を読んだときに覚えた興奮に近いものがこの本にはあると感じました。新しいものが登場して、今まさに革新が起きようとしていることが感じられる、といえばいいでしょうか。

技術者としては、この本が単なるハウツー本ではなく、Hadoopのパフォーマンスを実現している、その背景の考え方が丁寧に解説されているところに注目していただきたいと思います。PCの持っているさまざまなリソースを、どうやったら余すところなく使い切れるか、その追求の物語を楽しんでいただければと。

玉川さんご自身はHadoopの技術的な可能性や将来性などについて、どう見ていらっしゃいますか？

Hadoopはツールキットであり、完成品ではありません。これから実際の業務にさまざまな場面で使われていくと思いますが、Hadoopはあくまでその基盤であり、その上に何をどのように乗せていくのか、そこでユーザーの腕が問われていくことでしょう。

ただまあ、その未完成なところがおもしろいところでもあると思います。Hadoopユーザー会の発表でも非常に多岐にわたる事例紹介があって、大変おもしろかったです。

Hadoopを基盤として広がっている世界は非常に広くて、「Hadoopって何なんですか？」という問いには一言では答えづらいものです。その世界の概要を知るためにも、本書をぜひ手にとっていただければと思います。

読者の方、これから本書を手にとっていただく方に向けてメッセージをお願いします。

本書の刊行後、非常に多くの反響をいただきまして、本当にありがとうございます。今後とも、わくわくするような技術書を翻訳していけたらと思っていますので、どうぞよろしくお願いいたします。

オライリー社からもコメントをいただきました。「Hadoopの和書企画段階から、日本での盛り上がりを感じ、早期に出版をと思いました。玉川さんのお陰で、Hadoop本をよい時期に出版することができました。とても感謝しています。」

Hadoop
本書は、Hadoopの基礎から応用までを包括的に解説する書籍です。Hadoopの分散ファイルシステムHDFSやI/Oの効率化の仕組み、MapReduceについて詳しく解説します。後半ではHadoop管理者のために、HDFSと MapReduceを実行するためのHadoopクラスタの立ち上げと管理の方法を紹介。Hadoopに関心あるすべての人に必携の一冊です。（目次）