論文 - 犬塚 信博
-
Adapting to subsequent changes of environment by learning policy preconditions 査読あり
松井藤五郎 犬塚信博 世木博久
International Journal of Computer & Information Science ACIS Press 3 ( 1 ) 49 - 58 2002年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
強化学習における行動政策(強化学習では戦略を政策と呼ぶ)を状況の変化によっても適用できるか否かを判断する条件を学習する方法を提案した。強化学習は、可能な行動を繰り返し適用し、結果が良かったものの評価値を獲得し、評価値に従って行動戦略を獲得してゆく方法である。汎用性の高い学習法であるが、学習に時間が掛かる。一旦学習した戦略も、状況の異なる環境では再び高コストの学習をし直さなければならない。論文では、学習した政策の適用条件を概念学習で学習し、適用条件を満たさない範囲のみ再度強化学習を行う方法を提案した。迷路の評価問題でこれを実験した。
-
強化学習結果の再構築への概念学習の適用 査読あり
松井藤五郎 犬塚信博 世木博久
人工知能学会誌 人工知能学会 17 ( 2 ) 135 - 144 2002年04月
記述言語:日本語 掲載種別:研究論文(学術雑誌)
強化学習において、学習の後に環境が変化した場合、これを概念学習の手法を用いて再構成するための方法を提案し、実験によって評価した。環境の変化を強化学習の政策の適用範囲を事前条件の概念学習によって実現する既発表の方法を、帰納論理プログラミングの方法で拡張した。述語論理による表現が必要なブロックワールドの問題に適用し、帰納論理プログラミングと強化学習の融合的学習法の有効性を、実験によって示した。
-
Learning Preconditions for Control Policies in Reinforcement Learning 査読あり
松井藤五郎 犬塚信博 世木博久
Proceedings of the ACIS 2nd International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing ACIS 47 - 54 2001年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
強化学習における行動政策(強化学習では戦略を政策と呼ぶ)を状況の変化によっても適用できるか否かを判断する条件を学習する方法を提案した。強化学習は、可能な行動を繰り返し適用し、結果が良かったものの評価値を獲得し、評価値に従って行動戦略を獲得してゆく方法である。汎用性の高い学習法であるが、学習に時間が掛かる。一旦学習した戦略も、状況の異なる環境では再び高コストの学習をし直さなければならない。論文では、学習した政策の適用条件を概念学習で学習し、適用条件を満たさない範囲のみ再度強化学習を行う方法を提案した。迷路の評価問題でこれを実験した。
-
A Distributed Object System with Object Extension Framework 査読あり
山口陽平 犬塚信博
Proceedings of the ACIS 2nd International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing ACIS Press 871 - 878 2001年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
WEBを介してソフトウェアコンポーネントを組合せ的に利用できる環境が重要性を増している。論文では。柔軟にソフトウェアコンポーネントを組合せることのできる環境、オブジェクト拡張フレームワークを提案し、実装によって評価した。これによって容易にオブジェクトを継承し、修正が可能になった。またこれを利用したORB(ネットワークを介した遠隔のオブジェクトをローカルな計算機で利用する仕組み)を開発した。
-
多出力二分決定グラフのAPPLY交叉を用いた食物連鎖モデル 査読あり
武藤敦子 大野典 森脇康介 犬塚信博 伊藤英則
電気学会論文誌,C 電気学会 121-C ( 2 ) 423 - 429 2001年04月
記述言語:日本語 掲載種別:研究論文(学術雑誌)
既発表の2つの二分決定グラフを合成するAPPLY演算を遺伝的な交叉オペレーションとする進化的学習手法と、動植物が進化的環境に置かれた食物連鎖シミュレーション環境を用いて、食物連鎖現象を観察した。APPLY交叉によって安定した進化を得られることで、従来法と比べて格段に安定した生態系が得られること、食物連鎖現象が持続的に発展することを確かめた。また、競合的な動物が早い速度で高度な機能を獲得しつつ、他を死滅させずに発展する環境も実現できた。
-
Adaptive behavior by inductive prediction in soccer agents 査読あり
松井藤五郎 犬塚信博 世木博久
Lecture Notes in Artificial Intelligence, Springer-Verlag (PRICAI 2001, Topics in Artificial Intelligence) Springer 1886 807 - 807 2000年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
ロボットサッカーシミュレーションを例題として、エージェントの行動を制御するため、その行動後の状況を、帰納的な予測手法を用いて予測し、行動を適用させる方法を提案した。予測の方法に帰納論理プログラミングを用い、エージェントに関して分かっている事前の背景知識を論理的な知識として利用できる学習法を開発した。ゴールへのシュート、2エージェント間のパス等の基本動作について、エージェントに事前に与えた簡単な戦略の結果を予測し、予測に基づいて制御することで行動を適応できることを示した。
-
A proposal for inductive learning agent using first-order logic 査読あり
松井藤五郎 犬塚信博 世木博久
Proceedings of 10th International Conference of Inductive Logic Programming, Workis in Progress ILP2000 180 - 193 2000年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
エージェントの行動を帰納的な方法で学習、制御する汎用の枠組を提案した。プランニング、行動選択、行動評価のルーチンを持たせることで、各機能を独立させることができる。エージェントの動きが単なる運動制御でなく、意味的なレベルを含む高次元の機能の場合、論理的な判断が必要であり、このための行動評価機能が必要になる。このため、行動評価に論理的な知識を利用できる帰納論理プログラミングを用いた。JAVAとprologを組合せた実装を行い、評価した。
-
Pruning nodes in the alpha-beta method using inductive logic programming 査読あり
犬塚信博 藤本隼人 中野智文 伊藤英則
Proceedings of the ICML99 Workshop : Machine Learning in Game Playing, Regular Paper ICML99 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
帰納論理プログラミング手法をゲームプログラミングに応用し、α-β法によって探索するゲーム状態の探索順序を学習することによって効率的になることを示した。α-β法は、ゲームの状況の評価値を頼りに探索する際、既に見込める値以下の評価値の盤面は探索せずに捨てる(枝刈り)ことができることを利用した効率化手法である。このとき、評価値の高い順にゲームの盤面を調べることで効率化の度合いが高まる。論文は帰納論理プログラミングの手法で、探索の順序を決めるルールを獲得するもので、オセロゲームを用いて実験、評価をおこなった。
-
Producing GA Chromosomes for System Identification with Time Saving 査読あり
Ahmed Ezzat 犬塚信博 伊藤英則
Proceedings of the IASTEAD International Conference on Artificial Intelligence and Soft Computing. Honolulu, USA IASTED 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
遺伝アルゴリズム手法を用いでシステム同定を行うため、システムを染色体に符号化して生成する方法において、初期染色体を生成するための制約を検討した。関数式を表現現する染色体を生成する場合、多くのものは致死染色体となり、機能しない。論文では、染色体構造を関数を表すように遺伝子のタイプ規定し、関数の整合性を取るように制御することで、致死遺伝子を亡くし、これによって進化の初期段階におけるステップを大きく改善した。
-
Learning robot control by relational concept induction with iteratively collected examples 査読あり
犬塚信博 恩田太一 伊藤英則
Lecture Notes in Artificial Intelligence (Advances in Robot Learning - 8th European Workshop on Learning Robots) Springer 1812 71 - 83 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
関係概念の帰納学習の方法をロボットの行動学習に応用した。事例の収集と学習を繰り返す手法を提案し、その効果を確認した。ロボットの運動制御の学習は、センサーのノイズや行動の不確かさのため、論理的な方法は一般に適さない。論文では、敢えてこうした環境に論理的学習を適用する方法を研究した。論理的な学習法でもノイズによって厳密な解を得られない。そこで、繰り返し事例を採取し、回数毎に次第に最適な学習結果に収束するよう事例採取と学習のループをつくる方法を提案した。
-
Evolving cooperative actions among heterogeneous agents by an evolutionary programming method 査読あり
藤永貴之 森脇康介 犬塚信博 伊藤英則
Lecture Notes in Artificial Intelligence (Simulated Evolution and Learning - Second Asia-Pacific Conference on Simulated Evolution and Learning, SEAL'98, Selected Papers) Springer 1585 231 - 239 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
機能の異なる複数の自律エージェントが各固に相応しい働きを発現させるための進化的プログラミングの方法を研究した。それぞれの機能を担うエージェントは、全体を一つのシステムとみなすならば、サブシステムをなすと考えられる。こうした組み合わさったシステムを効率よく学習させることは、容易でない。論文では、システムのゴールを意味的にサブゴールに分解し、サブゴールごとの評価値を組合せ、さらにこれを、初期のサブゴールからより困難なサブゴールへと徐々にダイナミックに変動させる方法を開発した。この方法を使わない従来方では、現実的時間で学習できない問題を学習することができた。
-
Evolutionary cooperative interactions between competitive agents 査読あり
Tin Tin Naing 犬塚信博 伊藤英則
Proceedings of the 3rd Australian Commonsense Reasoning Workshop University of New South Wales 103 - 113 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
競合的な環境にあるエージェントが協調的な行動を獲得する方法を進化的なアプローチによって研究した。競合環境を表現する代表的なモデルとして囚人のジレンマを取上げ、これを繰り返す状況での戦略をオートマトンで表した。オートマトンを進化プログラミング的な方法で進化させすることで、最適の戦略について検討した。従来、最適と考えられる戦略の他に、興味深い戦略が得られた。
-
Evolution of game strategy for agents in dilemma situations 査読あり
Tin Tin Naing 犬塚信博 伊藤英則
Proceedings of the 2nd Asia-Pacific Conference on Industrial Engineering and Management Systems APIEMS99 473 - 476 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
ジレンマ状況のエージェントをゲーム理論的に考察し、ゲーム戦略を進化させる方法を与え、その振舞いを研究した。繰り返し囚人のジレンマについての戦略を進化させて得られた解について、ゲーム理論的に考察した。最善の戦略においては、ゲームの手がある種の均衡点になることが知られる。進化手法によって得られた戦略をこの観点から分析する方法を提案した。
-
Efficient induction of executable logic programs from examples 査読あり
犬塚信博 世木博久 伊藤英則
Lecture Notes in Computer Science (Advances in Computing Science - ASIAN'97, Third Asian Computing Science Conference) Springer 1345 212 - 224 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
ファジー論理プログラムをその事例から帰納するためのアルゴリズムを与え、実験によって効果を示した。ファジー論理プログラムは、論理プログラムに真理値を付与し、真理値関数、解釈、モデル、導出等の論理概念を整合の取れるように拡張する必要がある。拡張された論理体系に基づいて帰納を定義し、これを解くアルゴリズムを与えた。帰納論理プログラミングアルゴリズムFOILを自然に拡張し、これがファジー化された帰納問題でも有効であることを実験によって示した。
-
An induction algorithm based on fuzzy logic programming 査読あり
柴田大介 犬塚信博 加藤昇平 世木博久 伊藤英則
Lecture Notes in Artificial Intelligence (Methodologies for Knowledge Discovery and Data Mining - Third Pacific Asia Conference, PAKDD-99) Springer 1574 268 - 273 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
論理プログラムは、真偽を判断する利用法と入力から出力を出す処理への利用法がある。帰納的アルゴリズムを後者の利用法のために適用することのできるアルゴリズムを提案した。入力から出力を得る間数的なプログラムを得る場合、論理プログラム(あるいは実際的にはPROLOG)の述語の入出力モードに従うことが必要である。即ち、入力モードをもつ変数が値を持つためには、別の述語の出力モードの変数であるか、あるいは、与えられたものでなければならない。こうした制約を定式化することで、帰納アルゴリズムに組込むことで、帰納学習アルゴリズムを提案した。
-
An Evolutionary Method Using Crossover in a Food Chain Simulation 査読あり
武藤敦子 大野典 中村剛士 犬塚信博 伊藤英則
Lecture Notes in Artificial Intelligence, Springer-Verlag (Advances in Artificial Life - 5th European Conference, ECAL'99) Springer 1674 ( 2 ) 89 - 93 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
既発表の2つの二分決定グラフを合成するAPPLY演算を遺伝的な交叉オペレーションとする進化的学習手法を用い、動植物が進化的環境に置かれた食物連鎖シミュレーションを行った。食物連鎖は、存在する動植物の微妙なバランスにおいて成り立つ関係であり、バランスが外れると容易にその関係崩れ、種は死滅してしまう。食物連鎖シミュレーションを観察することは人工生命研究の1つの課題であるが、この環境を人工的に作り出すことがこの手法によって可能となったことを示した。
-
A study of descriptions from a viewpoint of finite awareness 査読あり
犬塚信博
Semiotica, Journal of the International Association for semiotic Studies Mouton de Gruyter 125 ( 1-3 ) 107 - 114 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
有限の視野(知識を操作できる範囲)を基礎にした知識と記述の研究を行った。記述の違いによって概念の意味が異なることを示した。システムあるいは人によって、思考する場合に考慮する概念の有限の集合(視野)には違いがあると考え、この視野の中で概念の意味をモデル理論的に定める。これによって概念の定義の仕方が異なることで意味に違いが出ること、また、人によって受け取り方が異なることを示した。論理的体系によって意味の分かり易さの順序を与え、これらを考察した。
-
A generation method to produce GA with GP capabilities for signal modeling 査読あり
Ahmed Ezzat 犬塚信博 伊藤英則
Lecture Notes in Artificial Intelligence (Multiple Approaches to Intelligent Systems) Springer 1611 118 - 126 1999年04月
記述言語:英語 掲載種別:研究論文(学術雑誌)
プログラムの進化をGA手法で行うため、プログラムを符号化するための方法を提案し、信号処理モデルに応用した。信号を表す関数をGA手法で扱うため、関数式を一次元のビット列(染色体)で表現する方法を提案した。通常、数式を進化手法で扱う場合、GP(遺伝プログラミング)手法を用いる。これは、プログラムの構造グラフへの操作を行うものである。論文ではGA(遺伝アルゴリズム)を用いることを可能にし、これによって効率的が学習を可能にする。
-
A Crossover for an Evolutionary Method Using an Extended Binary Binary Decision Diagram 査読あり
武藤敦子 大野典 森脇康介 中村剛士 犬塚信博 伊藤英則
Proceedings of the the European Congress on Intelligent Techniques and Soft Computing, Aachen, Germany EUFIT 179 - 184 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)
2つの二分決定グラフを合成するAPPLY手法を応用し、遺伝的な交叉オペレーションとする進化的学習手法を提案した。APPLYは、論理和や論理積等の2項論理演算子を2分決定木に適用するためのアルゴリズムである。この演算子をランダム演算に適用することで、2つの決定木の入出力をランダムに合成する演算を定義し、これを2分決定木を遺伝子とする交叉に用いる進化計算の方法を提案し、論理関数の学習によって評価した。
-
Soccer Agents Learning from Past Behabior with Inductive Logic Programming 査読あり
松井藤五郎 柏原和男 犬塚信博 世木博久 伊藤英則
Proceedings of the First IMC Workshop on Knowledge Mining in the Real-world IMC, Tokyo University of Science 1999年04月
記述言語:英語 掲載種別:研究論文(国際会議プロシーディングス)