Skip to content →

YamaXの現在とこれから – DeepL2始動 –

@coord_eです。こんにちは。

さて、YamaX。
@coord_e@Nyanyan_Cubeで話し合った結果、研究としてYamaXの開発を続けていくことになりました。

プロジェクトの名をDeepL2と言います。(Deep Locomotion Learning的な)

研究

ヒューマノイドの自己歩行学習をテーマにしています。
機械学習とシミュレータの技術を応用し、ヒューマノイドの歩行方法を学習させ、それを実機に適用することが目的です。

現状

今のところ、シミュレーション上での強化学習を実装するところまではできています。

ただしシミュレーションがうまく行きません。ここ数カ月悩みっぱです。

哀れにも直立さえできない。足が地面にめり込んでいます。

このシミュレーションの状態を見ず学習させようとしていた時期もありました。

まあ当然こんな状態ですので学習も進みません。

当初DQN(Deep Q Network)を採用する予定でしたが、GPU8コ積んでやってもメモリが足りなかったりしたので、状態が複雑な場合でも使えるDDPG(Deep Deterministic Policy Gradient)を使いました。並列プログラミングを勉強したら最新のA3Cも試して見る予定です。

シミュレータにGazebo、制御にROS lunarを使用し、深層学習ライブラリにはKeras + keras-rlを使用しています。Gazeboと強化学習の連携にgym-gazeboを使用しました。なんかkeras-rl開発止まってるみたいなのでDDPGできたらtensorforceに移行しようと思っています

ポータブルなDockerコンテナを作成し、nvidia-dockerを使用してAWS上のGPUで学習させます。

そして残念ながらまだ実機との連携はないです。

というかYamaX 4.0でまともに動くLinux載せた板がない。

例の白基板は寝ぼけながら作っていたみたいで、ミスがはびこっていました。幾度となく悪魔改造を施しましたが、結局動きませんでしたので修正した新基板を設計して、fusionPCBに製造してもらいました。

これを組み立てて、ROSでも乗っけて使用します。 EdisonはEOL(生産終了)なのでこの次からラズパイにします。

この新しい基板についてはまた別記事で紹介します。

ソフトウェアとGithub

以下のリポジトリで開発しています

基板

Y-modify/axion

ソフトウェア

Y-modify/yamax

ということで、進捗はこれからできる限りブログに載せていきたいと思っております。

しばらく間が空いてしまい申し訳ありませんでした。

Published in DeepL2 Y-modify YamaX ソフトウェア ハードウェア 告知 機械学習 謝罪 運営