先週と今週は続けて3連休だ。
先週の3連休は何してたっけ?思い出せないのは色々とまずい気がする。
それは置いておいて、今週は今週とて3連休で時間もあったので、最近他の人の記事で見かけたcourseraの講座を受けてみた。
この講座を受けるきっかけになった記事がこちら↓
Googleの機械学習のレッスンが無料で受けれて資格が貰える余暇。 : ひろゆき@オープンSNS
この記事を見て「強いな」と思ったのは、以下の部分。
さらに9/30までにコースを修了させると、 Google Cloud PlatformやAmazon Web Servicesを使って学習出来るqwiklabsの$30のクレジットがもらえた
りします。
5個のコースがあるので、$150ですよ!
タダでGCPを使って遊べる!強い!
ついでに前回のブログでも述べたように普段使っているAzure以外のクラウドプラットフォームを触りたかったというところもあったので実際に受けてみることにした。
講座の概要
受けた講座は以下。
Data Engineering on Google Cloud Platform | Coursera
この講座は5つのコースに分かれており、それぞれの内容は
- データ分析に利用する各サービスの特徴
- ノードのクラスタを作るDataprocの解説
- 巨大なデータベースに対してクエリを送るBigQueryの解説
- TensorFlowをGCPで使った機械学習の解説
- やってくるデータをストリーミングするPub/SubとDataFlowの解説
となっている。それぞれの所要時間は大体6-8時間ほどで、一日に12時間-18時間ほど費やせば二日と半日で終わる分量である。
全編を通すことで、GCPでデータ分析を行う際に必要な機能が一通り理解できることになる。
内容としては、基本的には動画を見ること、そして理解度を確かめるテスト、そして後述するLabがあり、講座内のテストとLabにすべて合格することで修了したとみなされる。
特に、4の機械学習の講座では、機械学習の基礎的な知識からそれぞれの分析手法、量的なデータとは、カテゴリカルなデータとはといったトピックまで網羅されており、機械学習入門の講座としても機能している。
講義の内容は全部英語だけれど、1に関しては日本語版があるのでそれを利用することもできる。
ただし、半分くらいはまだ翻訳されていない。
実践的な学習ができるのがこの講座の特徴
この講座には、要所要所にLabという講義が用意されている。
Labでは、実際にGCPを触りながら、それぞれのサービスを動かして学習する。
他の講座でもそれぞれ何らかのソフトやサービスと連携した実践形式の講義はあるが、この講座ではqwiklabというサービスと連携しており、スタートするとGCP用のアカウントが自動で作られ、一定時間だけ利用できるようになる。
この中である程度あらかじめ用意されたリソースやgithubのコードを用いて学習を行う。
プラットフォームの知識だけでなく実際の使い方も理解できるのは強い。
ただし、一部のサービスについてはバージョンアップによってUIが変わっており、特にBigQueryに関しては新UIと旧UIがあってデフォルトでは新UIが表示されているが解説は旧UIのものなので旧UIに切り替えるか、新UIで同じ機能を探さなければならない。
クラウドプラットフォームは日進月歩しているところがあり、ここでもそんな側面が見えた。
まとめ
クラウドプラットフォームに触れる方法はいろいろあり、Azureは入門書を買ってきてその通りに動かして学習した。
GCPの場合、courseraのこの講義を入門として使うのがその方法の一つのように感じた。
クラウドプラットフォーム利用の実践経験が欲しい人は試してみるべきかもしれない。