Rustで作るプログラミング言語

だいたいやりたいところまでやったので感想を。めっちゃ良い本なので、自作プログラミング言語興味ある人にお勧めです。 gihyo.jp どんな本 Rustを使ってスタックマシーン、パーサー、ASTインタープリター、バイトコードコンパイラ、実行環境を作っていきま…

2024-09-18

Diffusion Policyの学習にはシミュレーターが要らないという話

Robotics

Diffusion Policyの話。 github.com ここにあるコードを動かそうとすると、シミュレーターとしてGym環境が必要。論文を読んでいても、拡散モデルで軌道生成まではわかったが、それと強化学習が結びつかない。NNは次のActionを出力するから実質Policyなんだけ…

2024-09-15

Diffusion Policyの学習データを覗いてみる

python

Diffusion Policyを動かそうとしています。 github.com 学習データがhttps://diffusion-policy.cs.columbia.edu/data/training/からダウンロードできます。 zarrというフォーマットから画像を取り出して確認してみました。ソース import zarr from PIL impo…

2024-09-13

Rustで二項係数を求める

rust

Qiitaで見つけて面白かった記事の紹介。二項係数を定義通りにやろうとすると結構大変らしい。 32bitだとあっさりオーバーフローするのは想像できてなかった。 qiita.com ライブラリ使うならstatrsのbiominalが使える。 use statrs::function::factorial::bi…

2024-09-12

plottersで正規分布を書く

rust

正規分布と言うよりplottersのメモ。 cargo.toml [package] name = "ch1_normal_distribution" version = "0.1.0" edition = "2021" [dependencies] plotters = "0.3.7" ソースコード use std::f64::consts::PI; use std::f64::consts::E; use plotters::pre…

2024-09-08

Roboticsにおける世界モデルとは

ロボット系のニュースに良く登場してくる世界モデルについて整理してみました。社内の勉強会で使う予定でしたが、ボリュームが足らずここで公開します。強化学習におけるモデルまずは強化学習におけるモデルについて。強化学習第二版から「環境のモデル…

2024-09-01

Diffusion Policyのevalメモ

これの続きです。 natsutan.hatenablog.com 無事学習が終わったので、ドキュメントに従ってevalをしました。 python eval.py --checkpoint data/outputs/2024.08.31/18.46.54_train_diffusion_transformer_lowdim_pusht_lowdim/checkpoints/latest.ckpt --ou…

ぱたへね

はてなダイアリーはrustの色分けができないのでこっちに来た

2024-09-01から1ヶ月間の記事一覧