アジャイルデータサイエンスをやってみる – その1

Serialization

ハマったポイントのメモ

p.51 3.6.1 Pigのインストール
 ここで、最初は、brewでもインストールできるのかなぁ〜と思って、$ brew install pigとしたものの、
その次のサンプルの、sent_counts.pigでエラー多発。
そもそも、$ pig -x localで、gruntモード起動ができな状態だった。

そんな訳で、brewで入れた(というかちゃんと入っていたのかも不明)pigをアンインストールして、
本に書いてある通り、http://pig.apache.org/より最新の、0.13.0をダウンロードして、
使うことにした。

本の手順では、antした後、contrib/piggybank/javaでantという手順であったが、
ダウンロードしたファイル内の、READMEでは、ant testせよとあったので、実行。

これがハマりどころで、一向に終わる気配がなく、結局、8時間ぐらい時間がかかっていた。
しかも、結果は、エラー。それぞれのテストでは、failカウントがないため、よく分からないが、
追求せず、次のステップに進み、動作確認できたので、良しとした。

次に本のサンプルを動かす訳ですが、sent_counts.pigの先頭行のHOMEディレクトリの指定と、
avroのバージョンを合わせる必要がありました。

結果、週末色々と時間をかけた結果、無事にp.53と同様の結果を得る事ができました!!

投稿者:

naoya

IT業界(ネットワーク系)の管理職。2児のパパもやってます。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です