Hadoopがバージョン1.0へ。2.0、3.0の議論も進む

2012年1月5日

大規模分散処理フレームワークのHadoopの最新安定版「Hadoop 1.0.0」が、昨年12月27日に公開されました。これは、これまで安定版として開発されていた「Hadoop 0.20」ブランチの最新バージョンを1.0.0としたものです。

Hadoopは、前身となるNutchが2002年にDoug Cutting氏によって開発され、(このビデオの10分頃のCutting氏の発言によると)2008年にNutchからHadoopプロジェクトが分離。約4年を経てバージョン1.0へと到達したことになります。

Hadoop 1.0.0 Release Notes

今回バージョン1.0.0となった旧0.20ブランチのほかに、Hadoopには0.22、0.23など複数のブランチで開発が進んでおり、Hadoopに対する新しい機能、例えば従来のMapReduceを完全に書き換えたMapReduce 2などはこれら新しいブランチに対して実装が行われています。

つまり、今回のHadoop 1.0は、最新機能版ではなく、最新安定版がバージョン1.0と名乗っても問題がないほど安定したことをバージョン番号に込めたものだといえるでしょう。

Hadoop 2.0、3.0も登場へ

こうしたHadoop 1.0が登場した経緯とバージョン番号の扱いについて、shiumachi氏のブログ科学と非科学の迷宮にポストされたエントリ「[雑記]hadoopのバージョン表記について」で詳しく解説されています。

このエントリの図がとても分かりやすいので、引用させていただきます。

fig

このエントリおよびそこから参照されているHadoopのメーリングリストの議論によると、今後Hadoop 0.22がHadoop 2.0へ、Hadoop 0.23がHadoop 3.0になるのはどうか、という提案が多くの賛同を得ています。最終的な結論はまだ出ていないようですが、これらのバージョン番号を持つHadoopも今後コミュニティ内の手続きを経て登場することになりそうです。

(追記 2012/1/10:Cloudera社がバージョン番号に関する同社関連情報の日本語訳を公開しています)

あわせて読みたい

Java 機械学習・AI Hadoop MapReduce オープンソース




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本