制御対象をモデル化し制御器を設計するのではなく、制御を行いながら制御器を自動的に構成することを目的として制御学習に関する研究がさかんに行われている。 制御器としては、制御誤差をなくすことを目標とする連続値制御器以外に、バンバン制御のように操作量が有限個であり制御誤差をある範囲内に押さえることを目標とする離散値制御器が存在する。 この離散値制御器を、制御に失敗したことを知らせる強化信号のみに基づいて学習する方法が、倒立振子を制御対象として幾つか提案されている。
本研究では、ファジィ制御の対象としてはあまり議論されてこなかった離散値制御器を、ファジィ制御規則により記述することを試みる。 離散値制御器を記述するのに適したファジィ制御規則の形式と、その規則において学習を行うためのアルゴリズムを提案する。 このアルゴリズムに基づき、試行錯誤的に制御を行いながら倒立振子のための離散値制御器が学習可能であることを計算機シミュレーションにより示し、他の手法と比較することによって本研究の有効性を示す。