Diffusion Policyが難しい

ここの実装を動かそうとしている。

なんとかGenesisで学習データの生成、学習、学習結果の確認まで進める事ができた。結果はこれで駄目である。

三連休のDiffsion Policyの結果です。これが今の限界。 pic.twitter.com/ij9RR2fhsN
— natsutan (@natsutan) 2025年7月24日

ここまでのまとめ

先が長いが、一個ずつ対応して行きたい。

学習データが、初期位置から対象物をつかんで、初期位置に戻ろうとしているが、対象物にハンドが接触した時点で終了にしたい。これでタスクの難易度が下がるから、もう少し追いやすくなると思う。

ぱたへね