早くも今年をふりかえる

はじめに

岡本です。
ブログが始まってまだ5日目ですが早くもふりかえりですw

実はFDPの活動は10月からスタートしていて、ここに載せるのが追い付いていないのですが、仕事納めに年末らしいエントリが欲しくなったので概要だけ書いてみます。

それぞれについては後で詳細なエントリが出てくるかもしれません(メンバの皆さんに期待!)

これまでのあらすじ

10月

キックオフ

f:id:Okamoto-Takuya:20211224162305p:plain
チームの船出(ちなみにチーム名はBoatです)

fdp-blog.hatenablog.com

読書

メンバが全員揃って『機械学習って何?』というレベル0からのスタートなので、とりあえず本を買って読んでみます。
そもそもどんな本を読んだらいいかも分からないので、全員でググってそれらしい本を2冊読んでみました。

とてもラッキーなことに『勉強のためなら金に糸目は付けない(意訳)』という会社の方針を頂き、その後も月に数冊のペースでメンバが好きな本を買って読んでいます。

動画

同時にAIの基礎について評判の良い動画があると聞いたので、これも全員で視聴しました。

www.coursera.org

これは分かりやすくて良かったです。

ワーク#0(タイタニック)

機械学習のHello World的な、Kaggleのタイタニック問題をやってみました。

www.kaggle.com

  1. データ取得
  2. モデル構築
  3. 学習
  4. 予測
  5. 評価

といった機械学習の基本のキがなんとなくイメージできるようになりました。
さすがハローワールドです。

fdp-blog.hatenablog.com

11月

環境構築

タイタニックは初心者らしくGoogle Colaboratory を使いましたが、ソフト開発屋らしくコード管理したい!ということで、docker container + VS Code + Git/Github を使った開発環境を作ってみました。

機械学習とソフト開発の文化の違いみたいなものも見えてきて、なかなか興味深い学びがありました。

colab.research.google.com

fdp-blog.hatenablog.com

ワーク#1(クラスタリング)

そろそろ何か実践として手を動かしたいということでPOがお題を持ってきてくれました。

弊社のAgile Studioではリモート見学会というのを随時開催しているのですが、参加者から頂いた評価アンケートのデータが膨大でとても手作業で分析できないという事で、これを機械学習を使って改善できないか?という物です。

スプレッドシートに書かれた日本語のコメントを扱うので自然言語処理にも少し触れることが出来ました。

f:id:Okamoto-Takuya:20211228215828p:plain
クラスタリング結果

fdp-blog.hatenablog.com

ワーク#2(分類)

今度は同じお題を分類という手法を使って分析してみます。

『分類とクラスタリングって何が違うの?』がようやく理解できるようになりました。

f:id:Okamoto-Takuya:20211228220104p:plain
分類の答え合わせ

fdp-blog.hatenablog.com

ワーク#3(回帰)

クラスタリング、分類と来たので今度は回帰をやってみようかということで、再びKaggleから適当なお題を選んでトライしてみます。

100,000 UK Used Car Data setwww.kaggle.com

これまではネットにあるサンプルコードや、やってみました系の情報をほぼ写経に近い形で参考にしていたのですが、ここでは少し自分たちで考えて、色々な回帰のアルゴリズム比較に挑戦してみました。

f:id:Okamoto-Takuya:20211228222035p:plain
アルゴリズムによる予測精度の比較

公開スクラム

私たちのチームでやっている日々のスクラムを公開してみました。

朝会とふりかえりとモブプログラミングの様子を生中継しながら実施、緊張しました~

www.agile-studio.jp

12月

オンボーディング

ここで新しく三田村さんがジョインしたので再スタートの意味も込めてオンボーディングをやってみました。(キックオフ参照)

f:id:Okamoto-Takuya:20211228205135p:plainf:id:Okamoto-Takuya:20211228205200p:plain
オンボーディングの様子

ワーク#4(画像分類 with ニューラルネット)

3か月目に入りまた新しい領域に手を出してみたい!ということで、今度はニューラルネットに挑戦してみます。

これまたKaggleから適当なお題を選んでトライです。

Fruit and Vegetable Image Recognitionwww.kaggle.com

ここで初めての挫折!!
ここまでは比較的順調に進んでいた(やってみたら一発でそれらしい結果が出た)のですが、ここにきて壁に突き当たります。

学習しても予測精度が2%台とかでサッパリ結果が出なくなってしまいました。

色々と調べた結果、最終的には学習回数やパラメータ調整によって結果が大きく変動することがわかりホッと安心しました(いい成績が出た訳ではない)が、何となく雰囲気でやっていてもダメなことを痛感し身が引き締まる思いでした。

f:id:Okamoto-Takuya:20211228223852p:plainf:id:Okamoto-Takuya:20211228223829p:plainf:id:Okamoto-Takuya:20211228224317p:plain
フルーツと野菜の写真を判別する

おわりに

改めてふりかえってみるとたった3か月ですが色々やってきたなあ、という気持ちになります。

今年いっぱいで大枠としての学習期間は終了し、来年の1月からはFDPとして本格的なプロダクト開発をスタートします。

また新しいネタが沢山出てくると思いますので、チームの成長と共にここに記録していこうと思います。(メンバの皆さんに期待!2回目)

今年一年、ありがとうございました!
来年もよろしくお願いします!!