2024-09-01から1ヶ月間の記事一覧
だいたいやりたいところまでやったので感想を。 めっちゃ良い本なので、自作プログラミング言語興味ある人にお勧めです。 gihyo.jp どんな本 Rustを使ってスタックマシーン、パーサー、ASTインタープリター、バイトコードコンパイラ、実行環境を作っていきま…
Diffusion Policyの話。 github.com ここにあるコードを動かそうとすると、シミュレーターとしてGym環境が必要。論文を読んでいても、拡散モデルで軌道生成まではわかったが、それと強化学習が結びつかない。NNは次のActionを出力するから実質Policyなんだけ…
Diffusion Policyを動かそうとしています。 github.com 学習データがhttps://diffusion-policy.cs.columbia.edu/data/training/からダウンロードできます。 zarrというフォーマットから画像を取り出して確認してみました。 ソース import zarr from PIL impo…
Qiitaで見つけて面白かった記事の紹介。 二項係数を定義通りにやろうとすると結構大変らしい。 32bitだとあっさりオーバーフローするのは想像できてなかった。 qiita.com ライブラリ使うならstatrsのbiominalが使える。 use statrs::function::factorial::bi…
正規分布と言うよりplottersのメモ。 cargo.toml [package] name = "ch1_normal_distribution" version = "0.1.0" edition = "2021" [dependencies] plotters = "0.3.7" ソースコード use std::f64::consts::PI; use std::f64::consts::E; use plotters::pre…
ロボット系のニュースに良く登場してくる世界モデルについて整理してみました。 社内の勉強会で使う予定でしたが、ボリュームが足らずここで公開します。 強化学習におけるモデル まずは強化学習におけるモデルについて。 強化学習第二版 から「環境のモデル…
これの続きです。 natsutan.hatenablog.com 無事学習が終わったので、ドキュメントに従ってevalをしました。 python eval.py --checkpoint data/outputs/2024.08.31/18.46.54_train_diffusion_transformer_lowdim_pusht_lowdim/checkpoints/latest.ckpt --ou…