知性の核心に戻る...実際に未来は

20年前、私はマシンインテリジェンスの測定基準を作成し始めました。その時までに、第二AI冬の氷期に、AIが完全に欠いていたものを測定することに本当に興味があった人はほとんどいませんでした。 David L. Doweと私のように、エージェントと世界の相互作用のモデルが一連のビットであり、知性がSolomonoffとWallaceの理論を用いて作成されたアルゴリズム情報理論にリンクされた知性のメトリクスに興味があった帰納推論の その間、毎年数十種類のTuringテストのバリエーションが提案され、CAPTCHAが導入され、Davidは大きなスイッチアプローチに基づく非常に単純なプログラムを使用していくつかのIQテストを簡単に解決することを示しました。

そして、今日、新しいAIの春が到来しました。機械学習のフィールドが満開になり、より多くのAIベンチマークと競技会でAIへの実験的なアプローチがもたらされました(このブログの前回の記事を参照してください)。 この20年の見通しを考えると、昨年は多くの点で特別でした。汎用AIの評価に関する一連のワークショップの第1回は、様々なタスクに多様なソリューションを見つけることができる人工総合情報システム(AGI)システムの評価への関心が高まっていることを示しています。これらのシステムを評価することは、ロボットクリーナー、クレジットスコアリングモデル、機械翻訳機、自家用車など特定のシステムの従来のタスク指向の評価とは異なり、より困難です。ビデオゲームを使って汎用AIシステムを評価するというアイデアがありました。アーケード学習環境(Atari 2600ゲーム)またはより柔軟なビデオゲーム定義言語および関連する競争は、AGIおよびその最近のブレークスルーの評価にますます人気が高まっています。

去年も、Microsoftのマルメ、GoodAIのスクール、OpenAIのジムとユニバース、DeepMindのラボ、FacebookのTorchCraft、CommAI-envなど、さまざまな種類のAI評価プラットフォームの導入を目撃しました。これらのプラットフォームは、強化学習(RL)設定に基づいて、多くの異なるタスクを作成し、標準インタフェースを介してRLエージェントに接続することを可能にします。これらのプラットフォームの多くは、AIの新しいパラダイム、例えば深層強化学習や一部のオープンソースマシン学習ライブラリに適しています。数千回のエピソードや新たな作業に対する数百万歩のステップを経て、これらのシステムは人間のパフォーマンスよりも優れた性能を発揮します。 このパラダイムから導き出された多数のアプリケーションと画期的な進歩にもかかわらず、主な未解決の問題は、AIエージェントが表現とスキルをあるタスクから新しいタスクに再利用して、人間が行うように、いくつかの例を挙げれば、新しい仕事をはるかに早く学ぶことが可能です。これは、マッピング問題(通常は移転学習という用語の下で)と見なすことができますし、順次問題(通常は段階的、累積的、増分的、連続的またはカリキュラムの学習という用語の下で)と見ることができます。

以前の概念よりも新しい概念やスキルを構築するシステムのこの機能に関連する重要な概念の1つは、通常、「構成性」と呼ばれ、幼児期から人間によく記録されています。システムは、新しい問題を解決するために以前に学習された表現、概念、またはスキルを組み合わせることができます。例えば、エージェントは、部屋の外に出る可能性のある方法として、はしごを登る能力を組み合わせたり、エージェントが追加を学習した後に乗法を学習することができます。 私の意見では、以前のプラットフォームのうちの2つが合成性に適しています:MalmöとCommAI-env。 Malmöは3Dゲームのすべての要素を持ち、人工知能研究者は視覚と3Dナビゲーションを使ってエージェントを試して評価することができます。これは現時点でAIのホットな話題なので、Malmöを使った多くの研究論文がこれまで行ってきたことです。しかし、私にとって、マルメの最も興味深い機能は、複雑なものを作成するためにエージェントが必然的に以前のコンセプトとスキルを結合しなければならない建築と工芸です。 CommAI-envは明らかにこのプラットフォーム群の外れ値です。 2Dまたは3Dのビデオゲームではありません。ビデオやオーディオには何の役割もありません。インタラクションは、ちょうど+1、0、-1の入出力ビットと報酬のストリームによって生成されます。基本的に、行動と観測はバイナリです。 CommAI-envの背後にある論理的根拠は、コミュニケーションスキルに注目することですが、「さらに複雑さを最小限に抑えながら」、豊かな相互作用、パターン、およびタスクが可能になります。

f:id:miyamotok0105:20170222090521p:plain

General AI ChallengeがウォームアップラウンドにCommAI-envを使用していたことを知ったとき、私は情緒的でした。参加者は視覚とナビゲーションの複雑さなしにRLエージェントに集中することができました。もちろん、視覚とナビゲーションはAIアプリケーションにとって非常に重要ですが、徐々に学習することを理解し(評価する)ためには、さらに多くの複雑な問題が生じます。例えば、壁のテクスチャが変化する2つの等しいタスクは、同じテクスチャを有する2つのわずかに異なるタスクよりも高い転送労力を必要とすると見ることができる。言い換えれば、これは、タスク転送およびタスク依存性の分析をより困難にする余分な混乱要因となります。ウォームアップラウンドからこれを除外することが賢明な選択です。ビジョン、ナビゲーション、および他の種類の複雑な実施形態を含む他のラウンドの挑戦の機会があります。エージェントが段階的に学習できるかどうかを評価するための最小限のインターフェースから始めることは、一般的なAIにとって困難であるが重要な未解決の問題である。 また、ウォームアップラウンドでは、ビットが8ビット(1バイト)の文字にパックされるようにCommAI-envが変更されました。これにより、タスクの定義がより直感的になり、ASCIIコーディングがエージェントに対して透過的になります。基本的には、行動と観測のセットは256に拡張されています。興味深いことに、観察と行動のセットは同じであり、これらのサブセットが異なる強化学習では多くの可能性があります。例えば、 “入力を出力にコピー"や他のシーケンス変換演算子のようなプリミティブを持つエージェントは、タスクを解決するためにそれらを合成することができます。変数、および他の種類の抽象化は、重要な役割を果たします。

これは、チューリングマシンと象徴的なAIに戻っているという印象を与えるかもしれません。ある意味では、これが当てはまり、彼の1950年の論文でTuringのビジョンと非常に一致しています。「象徴語などの言語で与えられた命令に従うために罰と報酬によって機械を教えることは可能です。しかし、2017年には、ほんの数年前に利用できなかったさまざまな技術があります。例えば、ニューラルチューリングマシンやシンボリックメモリを持つ他のニューラルネットワークは、この問題に非常によく適しています。 これは決して深層強化学習愛好者の軍団がこのウォームアップラウンドに装置を持ち込むことができないことを示すものではありません。実際に、彼らはこの問題に深く学ぶために本当に熱心に取り組むなら、この挑戦​​に失望することはありません。視覚パターン認識のためにチューニングされた畳み込みネットワークは必要ないでしょうが、このような設定で深層学習を行うには、多くの可能性や課題があります。例。

プラスとして、シンプルで象徴的なシーケンシャルインターフェイスは、AIの多くの他の領域、すなわちリカレントニューラルネットワークだけでなく、自然言語処理、進化的計算、圧縮インスパイアされたアルゴリズム、または帰納的プログラミングなどの強力な文字列非常に少数の例を用いて問題に対する適切性を保証する。 私は上記のすべてがこのウォームアップラウンドを独特の競争にさせると思う。もちろん、私たちは過去に何も似ていないので、いくつかの驚きがあるかもしれません。予期せぬ(あるいはナイーブな)テクニックが他のもの(そして人間)よりもはるかに優れた動作をするか、現時点で何か意味のある技術を行うことができないことがあります。 私はこのラウンドがどのように発展し、参加者がマイクロタスクとミニタスクのシーケンスを解決するために統合し、発明することができるかを見たいと思っています。私はこれからたくさんのことを学ぶと確信しています。私はマシンもそうだと思う。そして、私たち全員が次のラウンドに進むでしょう!

参考

https://medium.com/ai-roadmap-institute/back-to-the-core-of-intelligence-to-really-move-to-the-future-8eb476c5dd36#.5efcaudb8