1 min read

「人工知能プログラミングのための数学がわかる本」を読む #3

nabeen

引き続きこの本を読んでいた。

今日は今までやったことのなかった自然言語処理だった。昨日、サポートサイトがないとか喚いていたんだけど、普通に GitHub にあった。書籍の最初の方に書いてあって、完全にぶっ飛ばして読んでいたので気づかなかった。

で、初の自然言語処理はどうだったかというと、ぶっちゃけ全くわからなかったので、GitHub のコードを写経しながら理解していった。

ただ最後のモデルを学習させるところで、僕これ Docker で Jupyter Lab 立ち上げて書いてたんだけど、Kernel Error みたいなんが出てしばらく詰まった。結果メモリが足りてなかったみたいで、Docker for Mac のクライアントでメモリ上限を 2G から 4G に引き上げることで対応した。

分類器そのものはロジスティック回帰だったので、そこはまぁ問題ないというか、過去にもやってきた内容だったのでよかったのだけど、前処理の部分が結構煩雑。

MeCab で形態素解析してベクトル化してうんぬんかんぬんな部分。これなんかもっと手軽にできないんだろうか。

まぁ機械学習は前処理がキモで時間かかるみたいな話もあるくらいなので、しょうがないのかなぁという気もするが、毎度毎度こんなことやるとなると、まぁそこそこ大変な気もする。

僕自身は自然言語処理はまだ今やるべきものではない(今回見たように結構難しい部分がある)と思っているので、今すぐにこれを理解したいってわけじゃないけど、将来的な目標である人工知能を作るってのを見据えた場合、ここを避けることはできないので、おいおい理解を深めていこうと思う。

とりあえず本書も明日で終わる予定なので、引き続きやっていく。

この後にも積ん読はたくさん控えているのだ。

P.S.

本書とは全くなんの関係もないが、セキュリティ関係で CTF ってのがあるらしく、これ結構面白そうだなと思った。多分競技プログラミングのセキュリティ版って感じ(だと思っている)。

最近全然やってないけど、競技プログラミング好きだし、なんなら Kaggle もそっち系だから、これ多分僕結構ハマりそう。

あとこれも今日空き時間で試してみたんだけど、かなりいいなと思った。

開発環境はまぁ今はみんな Docker で作ってると思うんだけど、それをもっとナチュラルに、Docker を Docker として意識しなくてもいい感じで立ち上がってくれる。ついでに VS Code の拡張も含めることができる。まぁここは宗教論争ありそうだけど...。