人工知能をめぐる動向

3.探索・推論

◆探索・推論の具体例を説明できる

◆探索・推論を実現する代表的な手法を説明できる

 

キーワード

【Mini-Max法】:ゲーム戦略。自分の番では自分のスコアが最大になる手を選択し、

        相手の番では自分のスコアが最小にになる手を選択する前提で戦略を立てる

        計算量が多い。

【αβ法】:Mini-Max法の無駄を省いた方法。評価する必要のないのノードは対象から外す。

     相手の選択肢を除外するのが αカット

     自分の選択肢を除外するのが βカット

【STRIPS】:(Stanford Research Institute Problem Solver)「前提条件」「行動」「結果」
      を記述するプランニング手法

 【SHRDLU】:1968~70年テリー・ウィノグラードによる積み木の会話プログラム

【探索木】:迷路の選択肢のようにツリー構造になっている探索方法

【幅優先探索】:探索木を検索する順序のことで、浅く広く探索をする。メモリを多く使用。

【深さ優先探索】:行けるところまで深く探索し、行きどまったらひとつ前のノードに戻る

【ハノイの塔】:探索木を使って解くことができるパズルの1つ。3本のポール、3つの円盤

 

【モンテカルロ法】:コンピュータが仮想的な2人を演じてゲームを何度もプレイアウトさせ

          どの方法が一番勝率が高いかを評価する方法。

          計算量が少なくなるゲーム終盤などで用いる。

【ブルートフォース】:力任せ モンテカルロ法のような、数多く打って最良のものを選ぶ

           といった手法を揶揄する言葉。

 

ボードゲーム

ボードゲームと探索は相性が良い。すべての選択肢から最適な手を選べば勝てる

 

手の組合せは天文学的な数字

 オセロ:10の60乗 通り

 チェス:10の120乗 通り

 将棋: 10の220乗 通り
 囲碁: 10の360乗 通り

 

しらみつぶしに探索することは不可能。

そこであらかじめ知っている知識や経験を利用してコストを計算し、

コストがかかりすぎる探索を省略する

ここで利用する知識をヒューリスティックな知識という

 

4.知識表現とエキスパートシステム

◆知識表現とは何か説明できる

  ⇒コンピュータが処理できるように知識を表現する手法 意味ネットワーク、オントロジーなど

◆エキスパートシステムとは何か説明できる

  ⇒コンピュータに特定の分野の知識を与え、専門家のように推論・判断を行う

◆知識表現に係る代表的な研究や手法について理解する

  ⇒イライザ、

◆エキスパートシステムに係る代表的な研究や手法について理解する

 

キーワード

【Cycプロジェクト】:一般常識をデータベース化して、人間と同等の推論システムを構築する

           1984年から始まり現在も入力中

【is-a の関係】:継承関係 矢印が向いている先が上位概念 「車は乗り物である」

【part-of の関係】:属性を表す 「目は頭の一部である」

【has-a の関係】:所有関係  part-ofと逆の関係 「車はタイヤを持っている」

 

【意味ネットワーク】:知識表現の方法の1つ。概念をノードで表し、

           概念間の関係をラベルのついた矢印で結んだネットワーク。

【イライザ (ELIZA)】:チャットボットの元祖 1964年 ルールに従って文を返すが

          人間と対話している錯覚(イライザ効果)に陥る

【DENDRAL】:世界初のエキスパートシステム 有機化学の知識を使用して未知の有機化合物を特定

【マイシン (MYCIN)】:1970年代 スタンフォード大学開発のエキスパートシステム

           感染した細菌を判断するシステム 500のルールをあらかじめ用意

【インタビューシステム】:専門家の暗黙知を引き出すためのインタビューシステムが研究された

 

【オントロジー】:概念を体系化するための学問

【WEBマイニング】:WEBデータ解析して知識を取り出す

【データマイニング】:ビッグデータを解析して有用な知識を取り出す

 

【セマンティック Web】:Webサイトが持つ意味をコンピュータに理解させ、

            コンピュータ同士で処理させる技術

【ワトソン】:IBM開発 クイズ番組で勝利 質問の意味を理解しているのではなく、

       質問に含まれるキーワードに関連する答えを検索している。

【Question-Answering】:ワトソンはQuestion-Answeringという研究分野の成果

【東ロボくん】:東大入試合格を目指す人工知能。読解力に問題がありPJ凍結。

 

知識獲得のボトルネック(エキスパートシステムの限界)

専門家からの知識獲得が難しい。

矛盾や一貫していないものがあるなど知識ベースの保守が困難。

 

意味ネットワーク(Semantic network)

知識表現の方法の1つ。

概念をノードで表し、概念間の関係をラベルのついた矢印で結んだネットワーク。

 

【is-aの関係】:継承関係 矢印が向いている先が上位概念

         「車は乗り物である」「動物は生物である」 

       例外を示さない限り、上位概念の属性を下位概念が全て引き継ぐ

 

【part-ofの関係】:属性を表す 一部である

         「目は頭の一部である」「肉球は足の一部である」

 

【has-aの関係】:所有関係 持っている part-ofと逆の関係

        「車はタイヤを持っている」

 

オントロジー(概念を体系化するための学問)

エキスパートシステムのための知識ベースにコストがかかるため、

知識の共有・再利用できるようにする知識工学。

トム・グルーパーの「概念化の明示的な仕様」が代表的。

 

概念間の関係

【is-aの関係】:継承関係「である」「車は乗り物である」「動物は生物である」 

        例外を示さない限り、上位概念の属性を下位概念が全て引き継ぐ

        矢印が向いている先が上位概念

       推移律が成り立つ A←B、B←C ならば A←C が成り立つ

 

【part-ofの関係】:属性を表す 一部である

         「日本はアジアの一部である」「東京は日本一部である」

         「ゆえに東京はアジアである」

        推移律が成り立つ場合と成り立たない場合がある

        part-ofは最低でも5種類ある。

 

■ヘビーウェイトオントロジー

 対象世界の知識をどのように記述すべきか哲学的に考察して行うもの。コスト高

 一般常識をすべ手動で取り込もうとするCycプロジェクトもその一例 

 

■ライトウェイトオントロジー

  効率を重視し、コンピュータに読み込ませてできる限り自動的に行う。

 WEBマイニングデータマイニングが利用されている。

  

5.機械学習

◆機械学習とは何か説明できる

  ⇒人工知能のプログラム自身がデータから学習する仕組み

  ⇒明示的にプログラムしなくても学習する能力をコンピュータに与える研究分野

              (アーサー・サミュエル 1959年)

◆機械学習とルールベース手法の差異、およびメリットデメリットについて説明できる

  ⇒ルールベース:専門家が特徴量の値を決めて答えを求めるシステムを構築する

          大量のデータを必要としない。インターネット以前。

   機械学習:専門家が特徴量を設定するが最適値はコンピュータが見つけだす

◆機械学習が注目されるようになった背景を説明できる

  ⇒インターネットの普及でビッグデータの収集コストが低下した

   大量データでモデルの精度が上がった

◆機械学習がどのような場面において、効果を発揮するのか理解する

  ⇒パターン認識 人が発見できないパターンを見つける可能性あり

◆機械学習の代表的な応用例について理解する

   ⇒スパムフィルター、レコメンデーションエンジン

 

キーワード

【次元の呪い】:データの特徴量が増えると学習を行うためのデータ量が著しく増加し、

        汎用性能の向上が難しくなる

        次元(特徴量)を減らす工夫(特徴選択)や良質のデータを大量に要する

【ビッグデータ】:インターネットの成長とともに蓄積された大容量のデータ

【スパムフィルター】:機械学習によるアプリ。迷惑メールかどうかを判断するアルゴリズム

【レコメンデーションエンジン】:機械学習によるアプリ。ユーザが興味ありそうなものを

                学習しリコメンドする

【統計的自然言語処理】:複数の単語をひとまとまりにした句または文単位で用意された

            膨大な対訳データをもとに翻訳される

【醜いアヒルの子定理】:分類するためにはどの特徴量で分類すべきか決める必要がある

            毛色、体重、性別、生まれ月など

 

特徴量設計

注目すべきデータの特徴を量的に表したものを特徴量という。

機械学習は特徴量として与えられたものを学習するだけで特徴量の選択は人間が行う。

特徴量を機械学習自身に発見させる ⇒ 特徴表現学習 

 

ディープラーニング(深層学習)は、特徴表現学習を行う機械学習アルゴリズムの1つ。

 

ニューラルネットワーク自身が複数のステップのコンピュータプログラムを学習できる。

与えられた問題を解くために必要な処理に役立つ情報が特徴量として抽出される。

自動的に特徴量が抽出されるため、判断理由が示せないブラックボックス型の人工知能と言われる

 

6.ディープラーニング

◆ディープラーニングがどのように発展してきたのか、その歴史を説明できる

  ⇒1958年に単純パーセプトロンというニューラルネットワークが提案された

   それを多層化したものがディープラーニング。

◆古典的な機械学習とディープラーニングの差異を説明できる

  ⇒特徴量を自ら探し出す

 

◆ディープラーニングの代表的な応用例について理解する

  ⇒2012年以降、ILSVRCのチャンピオンはすべてディープラーニングを利用

キーワード

【ILSVRC】:画像認識の精度を競う大会

      2012 ジェフリーヒントン率いるチーム「SuperVision」がモデル「AlexNet」で優勝

      2014 GoogleNet、2015 ResNet 

【ImageNet】:ILSVRC(ImageNet Large Scale Visual Recognition Challenge)画像認識大会

【CNN】:Convolutional Neural Network 畳み込みニューラルネットワーク

     画像データに適した構造

【ネオコグニトロン】:CNNモデルを最初に組み込んだモデル 福島邦彦による

【LeNet】:CNNモデルの一種 ネオコグニトロンと構造上似てる

 【アルファ碁 (AlphaGo)】:世界トップ棋士に勝利。人工知能注目のきっかけ

             モンテカルロ木探索、深層強化学習を組み合わせている

【特徴抽出】:ディープラーニングによって抽出した特徴。データの分類に有用

【人間の神経回路】:ニューロンを模した数理モデルがニューラルネットワーク

【LLM(大規模言語モデル)】:事前学習とファインチューニングによって文脈を理解し
               適切な回答を生成する。