早くも今年をふりかえる
はじめに
岡本です。
ブログが始まってまだ5日目ですが早くもふりかえりですw
実はFDPの活動は10月からスタートしていて、ここに載せるのが追い付いていないのですが、仕事納めに年末らしいエントリが欲しくなったので概要だけ書いてみます。
それぞれについては後で詳細なエントリが出てくるかもしれません(メンバの皆さんに期待!)
これまでのあらすじ
10月
キックオフ
読書
メンバが全員揃って『機械学習って何?』というレベル0からのスタートなので、とりあえず本を買って読んでみます。
そもそもどんな本を読んだらいいかも分からないので、全員でググってそれらしい本を2冊読んでみました。
とてもラッキーなことに『勉強のためなら金に糸目は付けない(意訳)』という会社の方針を頂き、その後も月に数冊のペースでメンバが好きな本を買って読んでいます。
動画
同時にAIの基礎について評判の良い動画があると聞いたので、これも全員で視聴しました。
これは分かりやすくて良かったです。
ワーク#0(タイタニック)
機械学習のHello World的な、Kaggleのタイタニック問題をやってみました。
- データ取得
- モデル構築
- 学習
- 予測
- 評価
といった機械学習の基本のキがなんとなくイメージできるようになりました。
さすがハローワールドです。
11月
環境構築
タイタニックは初心者らしくGoogle Colaboratory を使いましたが、ソフト開発屋らしくコード管理したい!ということで、docker container + VS Code + Git/Github を使った開発環境を作ってみました。
機械学習とソフト開発の文化の違いみたいなものも見えてきて、なかなか興味深い学びがありました。
ワーク#1(クラスタリング)
そろそろ何か実践として手を動かしたいということでPOがお題を持ってきてくれました。
弊社のAgile Studioではリモート見学会というのを随時開催しているのですが、参加者から頂いた評価アンケートのデータが膨大でとても手作業で分析できないという事で、これを機械学習を使って改善できないか?という物です。
スプレッドシートに書かれた日本語のコメントを扱うので自然言語処理にも少し触れることが出来ました。
ワーク#2(分類)
今度は同じお題を分類という手法を使って分析してみます。
『分類とクラスタリングって何が違うの?』がようやく理解できるようになりました。
ワーク#3(回帰)
クラスタリング、分類と来たので今度は回帰をやってみようかということで、再びKaggleから適当なお題を選んでトライしてみます。
100,000 UK Used Car Data setwww.kaggle.com
これまではネットにあるサンプルコードや、やってみました系の情報をほぼ写経に近い形で参考にしていたのですが、ここでは少し自分たちで考えて、色々な回帰のアルゴリズム比較に挑戦してみました。
公開スクラム
私たちのチームでやっている日々のスクラムを公開してみました。
朝会とふりかえりとモブプログラミングの様子を生中継しながら実施、緊張しました~
12月
オンボーディング
ここで新しく三田村さんがジョインしたので再スタートの意味も込めてオンボーディングをやってみました。(キックオフ参照)
ワーク#4(画像分類 with ニューラルネット)
3か月目に入りまた新しい領域に手を出してみたい!ということで、今度はニューラルネットに挑戦してみます。
これまたKaggleから適当なお題を選んでトライです。
Fruit and Vegetable Image Recognitionwww.kaggle.com
ここで初めての挫折!!
ここまでは比較的順調に進んでいた(やってみたら一発でそれらしい結果が出た)のですが、ここにきて壁に突き当たります。
学習しても予測精度が2%台とかでサッパリ結果が出なくなってしまいました。
色々と調べた結果、最終的には学習回数やパラメータ調整によって結果が大きく変動することがわかりホッと安心しました(いい成績が出た訳ではない)が、何となく雰囲気でやっていてもダメなことを痛感し身が引き締まる思いでした。
おわりに
改めてふりかえってみるとたった3か月ですが色々やってきたなあ、という気持ちになります。
今年いっぱいで大枠としての学習期間は終了し、来年の1月からはFDPとして本格的なプロダクト開発をスタートします。
また新しいネタが沢山出てくると思いますので、チームの成長と共にここに記録していこうと思います。(メンバの皆さんに期待!2回目)
今年一年、ありがとうございました!
来年もよろしくお願いします!!