AREKORE

daikikatsuragawaのアレコレ

2021年8月のアレコレ

これは何?

「ブログの記事になるほどじゃないなー」といった規模で思ったこと、感じたことがいくつかあります。そんなある日、nishibaさんの記事を読んで、いろんなことを書く形式、とてもいいな!と思いました。

note.com

自分のための備忘録としてアレコレ書いてみます。

本にハマる

2021年3月中旬以降、あるキッカケがあり、書籍の魅力に気がつきました。人生で一番のペースで読んでいます。苦手意識はあったんですが、よく考えたら学生時代、論文はひたすら読んでいたので、流し読みや取捨選択はまあまあできました。現代、ウェブでも無料で欲しい情報は得られます。しかし、書籍には金額以上の価値がある気がしています。

そんなことを思った直後、奇跡のタイミングでこんなキャンペーンに出会いました。元々は本にお金を使いたくない派だったのですが、「今だな…」と思って奮発してしまいました。これをキッカケに気になった本を買う癖がつきました。

prtimes.jp

「今月は節約しよう…」と思った直後、奇跡のタイミングで大量の古本を頂く機会がありました。200X年~2013年くらいの本ばかりで、少し古いです。しかし、取捨選択できるとただの宝の山になります。

そんなこともあり、とんでもない量のインプットを得ました。「シン・エヴァンゲリオン劇場版:||」に出てくる「碇ゲンドウ」の気持ちが分かった気がしました。気になる方は是非見てください。とてもよかったです。

ただ、気持ちだけ大きくなって、何かアウトプットできているわけではありません。今後は成果を生み出すために、学んだことを実施していく段階に集中しようと思います。

「意思決定分析」に詳しくなりたい

「意思決定分析と予測の活用 基礎理論からPython実装まで」という本にすごくハマりました。

まだ読みかけですが、「意思決定分析」に詳しくなることを決意しました。ある分析・モデルがあったとして、それに対して以下のような疑問がありました。

  • 導入する場合の費用対効果はあるのか?
  • 取り組む価値があるのか?
  • 精度はどれだけあれば十分か?
  • 使い物になるのか?
  • 価値があるのか?

それらを明らかにする理論などが書いてあったりします。上述したことは研究をしていた時から悩んでいたことだったり、ビジネスにおいても重要だと思います。それゆえに使いこなせるようになりたいなと思いました。まずは学んだことを、プライベート・仕事に関わらず何かに落とし込んでみたいと思います。ただ、現実の事象に当てはめることは難しそうなので、まずは「なんとなく」を目標にします。

ドメイン駆動設計がとても大事かもしれない(特に機械学習を扱うプロダクトにおいて)

業務でサンプルデータを作成していた時、現実ではありえない値を生み出したりしてしまいました。まあ、それはただのポンコツミスではあるんですけど、「値オブジェクト(ドメイン駆動設計の一部)」を使ったらいいなと思い、ちょっとしたスクリプトですが使うようにしました。

ふと思ったんですが、データサイエンスにおいて「ドメイン知識大事!」って考えもあるので、ありえない値、作っちゃいけないなと思いました。

もしかしたら…予測結果として頓珍漢な値を出すことってあるんですかね? それも予測しちゃう前に値オブジェクト使うといいんじゃないかと思いました。

もしかしたら…現実的じゃないタイミングで予測や推薦などアプローチしちゃうことってあるんですかね? それも値オブジェクト使うといいんじゃないかと思いました。

正直、ドメイン駆動設計の真髄まで知れていないですが、機械学習を扱うプロダクトと現実世界の懸け橋になるんじゃないかと感じています。

OSSの草=勉強量?

ある人と話した時に「あなたのGitHubアカウント(おそらく草)を見て、他のエンジニアとともに『勉強量がすごい』と感心していた」ってありがたい言葉をいただいた。しかし…その草のほとんどは、ソフトウェアエコシステムの貢献のための活動だった(そのつもりだった)。正確には、勉強のためにやってたこともあるけど、純勉強はない。決してその方々が悪いって話ではなく、日本のGitHubユーザの多くが勉強の証として利用してあるからなのだろうなと感じた。確かにどんなことでも学びにはなるが、自分がやっている仕事に対して「毎日8時間ほど勉強をしている」と考えると少し違う。そこがモヤモヤした。一旦モヤモヤを整頓して、今後こんなことがあったらちゃんと言ってみよう。

「新卒3年目の目標」の途中経過(4ヵ月経過)

ブログやってみる(まさにこれ)

謎のペースですがやれています。思考がまとまる、そのキッカケになるのでいいですね。以下の書籍でですごくモチベーションが高まりました。

ただし、この書籍でも言及されているように、情報発信により時間を失ってしまうため費用対効果を高めていきたいです。

仕事でデータサイエンス的な成果をリリースする(もしくはリリース見込みまで)

これは…何かしら言える状態(外に情報を出せる状態)をゴールとします。ということで、まだですね。

Kaggleで何かしら言える結果を出す(時には称号も大事!)

実は「Notebooks Expert」になりました。

www.kaggle.com

AutoMLの布教のためにAutoML系ライブラリを使ったサンプル(特に入門用)をひたすら生成していました。 また汎用的にするためにほぼ同じNotebookで似たようなコンペに参加していました。 それでコツコツと「bronze medal」を頂き、気が付いたらなっていました。

なにか統計・データ関係の資格を取る(時には称号も大事!)

これは…とっていません!統計検定2級とDS検定は今年中に受けようかなと思っています。

何かOSSをリリースする

これはまあまあいい感じにできたと思います。自分発のOSSを3件リリースしました。

github.com

github.com

github.com

PePyと言うウェブサイトで利用数の確認が可能です。地味に利用されているんですかね🤔

https://pepy.tech/project/df4looppepy.tech

https://pepy.tech/project/autoarmpepy.tech

実は、いいことがいくつかありました。

  • 実業務でdf4loopを利用
  • clasp-actionへのプルリクエス

得意を伸ばしつつ苦手をなくす

これもなんとなくな目標ですね。これに関しては少し考え方が変わりました。なんとなくしか言語化できないですが、苦手をうまく使いこなして単純に得意のカバレッジを増やせるんじゃないかなと。