グーグル、分散処理のためにデザインされた言語「Sawzall」をオープンソースで公開

2010年11月4日

グーグルは、同社内でパラレルデータ処理に利用している言語「Sawzall」を、「Szl」というプロジェクト名のオープンソースとして公開しました。

szl - Project Hosting on Google Code

書籍「Googleを支える技術」によると、Sawzallは分散処理のためにデザインされたDSL(Domain Specific Language)で、特定の用途に限っては非常に容易に処理を記述できるようになっているインタープリタ型のプログラミング言語。GFS(Google File System)とMapReduceを基盤とし、MapReduceをより簡単に実行できるものと説明されています。

なぜSawzallはオープンソースとして公開されたのか?

グーグルは2003年8月に、論文「Interpreting the Data: Parallel Analysis with Sawzall」を発表し、これによってSawzallという言語がグーグルによって開発され、社内で利用されていることが広く知られることになりました。

この論文によるとSawzallは、エラーがあっても「エラーがあった」というフラグを立てるだけで処理はそのまま継続してしまうという「エラー忘却型コンピューティング」という新たな概念を実装した言語だと説明されています(参考:そのソフト,売る?売らない? - 記者のつぶやき:ITpro)。

こうした論文は公表されたもののSawzallの言語実装そのものはこれまで社外に提供されることはなく、また、Sawzallの基盤となるGFSやMapReduceについても、過去にグーグルから論文は公開されていますが、実装が公開されたことはありませんでした。

今回なぜ、言語のSawzallをオープンソースとして公開したのか、現時点でグーグル関係のブログによる解説などは行われておらず、いまのところその理由は不明ですが、また1つ、MapReduce関連の技術を進歩させるオープンソースソフトウェアが登場したといえそうです。

Yahoo!からはリアルタイムMapReduceのS4が公開されたと前回の記事「リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開」でお伝えしたばかりですし、10月のHadoop WorldではNTTデータがClouderaと提携したことを、記事「Hadoop WorldでClouderaと提携したNTTデータが目指すもの。Hadoop World: NYC 2010」でお伝えしていますし、このところMapReduce関連のニュースが相次いでいますね。

あわせて読みたい

プログラミング言語 Google MapReduce




タグクラウド

クラウド
AWS / Azure / Google Cloud
クラウドネイティブ / サーバレス
クラウドのシェア / クラウドの障害

コンテナ型仮想化

プログラミング言語
JavaScript / Java / .NET
WebAssembly / Web標準
開発ツール / テスト・品質

アジャイル開発 / スクラム / DevOps

データベース / 機械学習・AI
RDB / NoSQL

ネットワーク / セキュリティ
HTTP / QUIC

OS / Windows / Linux / 仮想化
サーバ / ストレージ / ハードウェア

ITエンジニアの給与・年収 / 働き方

殿堂入り / おもしろ / 編集後記

全てのタグを見る

Blogger in Chief

photo of jniino

Junichi Niino(jniino)
IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。
詳しいプロフィール

Publickeyの新着情報をチェックしませんか?
Twitterで : @Publickey
Facebookで : Publickeyのページ
RSSリーダーで : Feed

最新記事10本