プロジェクト

【災害現場におけるロボットの自律および遠隔制御を支える基盤技術の構築(小林一郎・小口正人)】

災害現場で使用されるロボットに対して、(i) 外乱が多い状況の中で頑健な制御が行われること、 行動の効率の良い学習方法、及び、(ii) 環境の変化に対して適応的かつ頑健な無線通信手法の構築が望まれる.

(i)の実現のために、外乱に強い制御方式の提案、及び、環境情報を報酬として行動方策を学習する強化学習を効率良く行う手法の提案を行った (災害現場における頑健なシステム制御手法の開発)

また、(ii)の実現のために、様々な環境情報に基づいた通信の品質をシミュレーションにより検証し、災害現場においても通信対象(ロボットなど)への頑健な無線通信技術を開発した (災害現場でも威力を発揮する頑健な無線通信技術の開発)

以下、それぞれについて報告する.




災害現場における頑健なシステム制御手法の開発.(担当:小林一郎)

(a) パーティクルフィルタを用いた頑健な行動制御の実現

パーティクルフィルタのトラッキング機能を用いて、運動方程式に依らない、倒立振子の制御モデルを提案し、物理シミュレータPhysX上で制御動作を確認した. 通常、倒立振子の制御には、微分方程式に基づく運動方程式を用いるが、外乱などが存在した場合、運動方程式に則った制御が困難になる. そのため、本研究ではパーティクルフィルタを用いて、物体の変動量に比例する制御入力を与えることで、柔軟かつ頑健な制御を実現した.

(b) 強化学習の導入による災害環境下での適切な行動方策の獲得

ロボットの行動を学習制御するためには、強化学習が頻繁に用いられる. 一般に、強化学習では,エージェントが環境を探索し,与えられたタスクを試行錯誤を繰り返しながら最適な行動規則を求める. しかし,強化学習はタスクの状態を逐次的に探索しながら学習を行うため,問題点として多くの学習回数を必要としてしまうことが挙げられる. そこで,エージェントの学習回数の削減を目指した研究が数多くなされており,転移学習では類似したタスクで事前に学習した行動規則を,新しいタスクで再利用することにより,学習の効率化を図っている. しかし,転移学習において環境やタスクの類似性の定義は明確にされていないため,それぞれのタスクに応じた方法で類似度を計算する必要があるが, タスクの状態数やエージェントのとりうる行動数が膨大な場合には,類似度計算が複雑になってしまう. そこで,本研究では強化学習で得られたデータをスパースコーディングを用いて基底の集合 (辞書) とスパース行列 (係数行列) に分解する. のように複雑な類似度計算にスパース性を持ち込むことにより,従来よりも単純な表現で再現性のあるタスク分類の実現可能性の検証を行った.




災害現場でも威力を発揮する頑健な無線通信技術の開発.(担当:小口正人)

災害現場で有効に働くのはモバイル環境における無線通信技術である. 本研究では様々な場面における無線通信技術の進展を目指し,以下の2点について,シミュレーションを用いて検討を進めた.

(a) 移動端末の周辺情報を利用した通信制御

本研究では端末が移動する事を想定し,多数の端末が競合する通信環境における制御について検討した. 近年WLAN(Wireless Local Area Network)による通信が一般化しているが,WLAN において通信に用いられる通信パラメータは各々が独自のアルゴリズムに従って設定されており,その場の環境に応じた通信設定は行われていない. 一方,モバイル機器は様々なセンシングデバイスを持つようになってきたが,そこから得られる精密な環境情報(コンテキスト)は,無線通信においては有効に活用されていない. 従って本研究では,周辺情報を無線通信の上位層であるTCP のパラメータ設定に利用し,各端末が周囲の状況に応じた最適な輻輳制御を行うことで,通信効率の向上を目指した. シミュレーションによる評価結果により,コンテキストを通信パラメータの設定に利用する事で,より適した通信制御を行えるようになり,全体の通信効率向上に繋がる事が示された.

(b) マルチホップマルチレートネットワークにおける接続先選択

災害現場では固定的なアクセスポイントだけでなく,モバイルノード自体が他のノード間の通信を仲介するマルチホップネットワークが有効である. 送信目的ノードまでの接続経路が複数存在し,それぞれに伝送レートが異なるような(マルチレート)ネットワークのスループットは接続先選択に大きく依存する. この接続先選択において,本稿で検討対象とするのは次の二つの特性である;
一つは,ノードからの距離が遠くなるにつれてマルチレート制御によって伝送レートが低下するため, スループットが低下してしまうこと, もう一つは,ホップ数増加にともなってCSMA/CA の送信機会の関係からスループットが大幅に低下してしまうことである.
これらの特性を考慮し,シミュレーションを用いた解析により,様々なケースにおけるマルチホップ通信性能を評価し,どのような条件の場合にどのように接続先選択を行うのが最も適しているか,という点について明らかにした.




研究発表

  • Midori Saito and Ichiro Kobayashi, "A Study on Using Multiple Sets of Particle Filters to Control an Inverted Pendulum", The International Conference on Intelligent Automation and Robotics 2013, (World Congress on Engineering and Computer Science 2013), San Francisco, 2013.( Certificate of Merit (Student)を受賞)
  • 齋藤 碧、小林 一郎、「システム制御におけるパーティクルフィルタの適用に関する一考察」、1G4-1in、富山、第27回人工知能学会全国大会、2013.
  • 齋藤 碧、小林 一郎、「パーティクルフィルタを用いたロボット制御への取り組み」、2R-5、第75回情報処理学会全国大会、仙台、3月、2013.
  • 齋藤 碧、小林 一郎、「スパースコーディングを用いた強化学習における転移学習の一考察」、2U-5、第76回情報処理学会全国大会、東京、3月、2014.(学生奨励賞受賞)
  • 飯尾 明日香、前野 誉、高井 峰生、小口 正人、「無線LAN環境における移動端末間の公平性を考慮した輻輳制御手法の提案と評価」、第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014),E8-6, 2014年3月.
  • 藤井 聡佳、村瀬 勉、小口 正人、「マルチホップマルチレートネットワークでの接続先選択ポリシーと接続元別重み付けスケジューリングにおける通信性能評価」、第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014),C9-4,2014年3月.
  • 長谷川 友香、高井 峰生、小口 正人、「広域災害時に利用可能な Web アプリケーションのためのDTN フレームワーク」、第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014),E7-1,2014年3月.(学生プレゼンテーション賞受賞)

プロジェクトトップページに戻る

 

Copyright (C) 2011-2014 お茶の水女子大学シミュレーション科学教育研究センター, All rights reserved.
omo