re:sweater

知識のrecycle精神で、warmyにAI世界を渉りたい。そう願いながらAI界隈やらを綴ります。

本Blogにおける注意事項と凡例

本ブログにおける注意事項と凡例をまとめておきます。特に自己採点の記事の利用に際しては、予めご了承下さい。

注意事項

  • 本ブログの記載は、あくまでも個人として、理解の深化・記憶の定着・備忘録等を目的としています(自己採点の記事については、自己採点を通じて試験の復習をし、理解の進化、記憶の定着を狙っています)。
  • よって、本ブログの記載に関して、誤謬や内容の間違いに限らず、ここから派生することも含めて一切の責任を負いかねます。
  • なお、参考にしていただくのは一向に構いませんし、色々と議論したり教え合ったりはむしろ歓迎いたします。率直に言えば、皆様に教えていただきたいですし、逆に少しでもお役に立てればという思いもございます。
  • あくまで、皆様の善意を前提としています。やはり、これらにより発生する事柄についても一切責任は負いかねますので、予めご了承ください。

凡例

記号 説明 具体例
T. 公式テキスト(Official Text)のページ T.9は公式テキストのページ9
X. 問題集(EXercise book)のページ X.10は問題集のページ10
XI. 問題集(EXercise book)の設問(Item)

XI.3-11は問題集の第3章の第11問

XI.8-12は問題集の第8章(総仕上げ問題)の第12問

     

G検定2019#3自己採点011−020

前回に引き続き、2019年11月9日に行われたJDLA ジェネラリスト検定の自己採点をしていきたいと思います。今回も10問。

011問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢をを1つ選べ。
古くからAIによってチェスや将棋などのゲームで人間に勝てるAIをつくろうという研究はなされていた。チェスAIであるディープブルーはカ任せ(ブルートフォース)の探索をするプログラムであったが、性能としては(ア)、ここで利用されているような探索手法には、(イ)という課題に十分対応できなかった。

A) 世界チャンピオンに勝利するまでに違した
B) 初心者にやっと勝てる程度のものだった
C) 人間相手にはまるで歯が立たないものだった
D) そもそも、ゲームのルールを教えることができていなかった

> 011問の予想解答

012問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
古くからAIによってチェスや将棋などのゲームで人間に勝てるAIをつくろうという研究はなされていた。チェスAIであるディープブルーはカ任せ(ブルートフォース)の探索をするプログラムであったが、性能としては(ア)、ここで利用されているような探索手法には、(イ)という課題に十分対応できなかった。

A) 組合わせが膨大になる
B) ルールを教えることが難しい
C) 強化学習の計算量が膨大すぎる
D) 学習させる上で必要となる量の棋譜のデータが集まらない

> 012問の予想解答

013問

AI・機械学習ディープラーニング・データサイエンスといった用語の意味として、最も不適切な選択肢を1つ選べ。

A) 機械学習はAI研究の一分野として発展してきた

B) ディープラーニング機械学習の一手法である
C) ディープラーニング教師あり学習教師なし学習強化学習のすべてで利用できる
D) AIとデータサイエンスの違いは、機械学習を利用するかしないかである

> 013問の予想解答 

014問

AIがどれだけ知的かを評価する方法として、審査員に相手がAIであることを伏せて対話させ、どの程度の割合で相手がAIであると判定できるかを調べるという方法がある。この方法を指す最も適切な選択肢を1つ選べ。

A) マルチェージェントシミュレーション
B) AUC評価
C) チューリングテスト
D) 中国語の部屋

> 014問の予想解答

015問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
高度な技術を使わなくとも、機械が知的な振る舞いをするように見える例として、1996年に開発された(ア)が挙げられる。(ア)は簡単なルールべースの対話型プログラムで人工無能の元祖とも言えるプログラムである。

A) Watson
B) Sixamo
C) ELLA
D) ELIZA

> 015問の予想解答

016問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
コンピュータにとっては、知能テストやチェッカーをこなすよりも、1歳児レベルの知見と運動のスキルを与えるほうが遥かに難しいという(ア)が広く知られている。

A) モラベックのパラドクス
B) みにくいアヒルの子定理
C) ノーフリーランチ定理
D) グルーのパラドクス

> 016問の予想解答

017問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
従来の機械学習手法では特徴量の設計は一般に難しかったが、ディープラーニングは特徴量そのものを学習によって得ることができ、入力の良い(ア)を獲得できるようになった。また(イ)のような手法は、従来の主成分分析(PCA)ではできなかった非線形性を持つ特徴抽出・次元削減などの表現学習が可能である。

A) 意味解釈性
B) 交互作用
C) 共変量シフト
D) 内部表現

> 017問の予想解答

018問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
従来の機械学習手法では特徴量の設計は一般に難しかったが、ディープラーニングは特徴量そのものを学習によって得ることができ、入力の良い(ア)を獲得できるようになった。また(イ)のような手法は、従来の主成分分析(PCA)ではできなかった非線形性を持つ特徴抽出・次元削減などの表現学習が可能である。

A) 重回帰分析
B) データ拡張
C) 自己符号化器
D) 回帰結合ニューラルネットワーク

> 018問の予想解答

019問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
1991年以降、チューリングテストに合格する会話ソフトウェアの開発を目指すためのコンテストとして(ア)が毎年開催されている。

A) ローブナーコンテスト
B) ダートマスコンテスト
C) イメージネット
D) チューリングコンテスト

> 019問の予想解答

020問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
第2次ブームでは、いかにして機械に知識を与えるかが大きなテーマになった。例えば、自然言語の研究では、言葉どうしの意味関係を定義する(ア)などが提案された。しかし、これを完璧にすることには大変な労力を要するため、断念される場合があった。ただし、ダグラス・レナートによって提唱された現代版バベルの塔と呼ばれる(イ)は現在も継続している。また、仮に言葉どうしの意味関係がわかったとしても、現実の概念と結び付けられるかという(ウ)が待ち受けている。

A) 意味構造認識
B) 含意認識
C) 意味ネットワーク
D) べクトル空間モデル

> 020問の予想解答

 

011問の予想解答

A) 世界チャンピオンに勝利するまでに違した
根拠:X.203、XI.8-6

011問

012問の予想解答

A) 組合わせが膨大になる
根拠:T.32-33

> 012問

013問の予想解答

D) AIとデータサイエンスの違いは、機械学習を利用するかしないかである
根拠:AIが機械学習を利用するのは明らかだろう(T.10など)。Wikipediaにもある通りデータサイエンスも機械学習を利用する。

> 013問

014問の予想解答

C) チューリングテスト
根拠:T.71

> 014問

015問の予想解答

D) ELIZA
根拠:T.34

> 015問

016問の予想解答

A) モラベックのパラドクス
根拠:X.99(ほぼそのままの表現)

> 016問

017問の予想解答

D) 内部表現
根拠:コトバンクにこうある。

ディープラーニングは…局所的特徴から大域的で抽象度の高い特徴に至る階層構造をもった特徴表現内部表現や潜在表現ともよばれる)をデータから学習することを可能にする、表現学習の一種

> 017問

018問の予想解答

C) 自己符号化器
根拠:X.122(ほぼそのまんまの表現)

> 018問

019問の予想解答

A) ローブナーコンテスト
根拠:Wikipedia

> 019問

020問の予想解答

C) 意味ネットワーク
根拠:X.99「意味ネットワークとは、言葉同士の意味関係をネットワークとして表したモデル」

> 020問

注意事項

  • 上記記載は、あくまでも個人の自己採点と復習、それらによる理解の深化、記憶の定着を目的としています。
  • よって、上記記載に関して、誤謬や内容の間違いに限らず、ここから派生することも含めて一切の責任を負いかねます。
  • なお、参考にしていただくのは一向に構いませんし、色々と議論したり教え合ったりはむしろ歓迎いたします。率直に言えば、皆様に教えていただきたいですし、逆に少しでもお役に立てればという思いもございます。
  • あくまで、皆様の善意を前提としています。やはり、これらにより発生する事柄についても一切責任は負いかねますので、予めご了承ください。

凡例

記号 説明 具体例
T. 公式テキスト(Official Text)のページ T.9は公式テキストのページ9
X. 問題集(EXercise book)のページ X.10は問題集のページ10
XI. 問題集(EXercise book)の設問(Item)

XI.3-11は問題集の第3章の第11問

XI.8-12は問題集の第8章(総仕上げ問題)の第12問

     

G検定2019#3自己採点001−010

2019年11月9日に行われたJDLA ジェネラリスト検定の自己採点をしていきたいと思います。226問もあるのでいつ終わるか若干心配ですが…。まずは10問ずつを目標に。

001問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢をを1つ選べ。
AI研究には過去に2度のブームが起こり、現実的な進展が周囲の過剰に期待に追いつかず、それらのブームは終焉を迎えた。第1次AIブームの時代は、(ア)で問題を解く時代であった。しかし、それでは迷路やパズルといった(イ)しか解くことができず、適用範囲が狭いことが課題だった。第2次ブームでは、(ウ)が登場した。適用範囲は広がったが、知識を明示的な形で記述することの難しさがネックとなり、ブームは終焉した。

A) 設計や構築
B) 探索や推論
C) 認識や検出
D) 分類や回帰

> 001問の予想解答

002問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
AI研究には過去に2度のブームが起こり、現実的な進展が周囲の過剰に期待に追いつかず、それらのブームは終焉を迎えた。第1次AIブームの時代は、(ア)で問題を解く時代であった。しかし、それでは迷路やパズルといった(イ)しか解くことができず、適用範囲が狭いことが課題だった。第2次ブームでは、(ウ)が登場した。適用範囲は広がったが、知識を明示的な形で記述することの難しさがネックとなり、ブームは終焉した。

A) フレーム問題
B) チューリングテスト
C) トイプロブレム
D) A/Bテスト

> 002問の予想解答

 

003問

以下の文章を読み、空欄(ウ)に最もよく当てはまる選択肢を1つ選べ。
AI研究には過去に2度のブームが起こり、現実的な進展が周囲の過剰に期待に追いつかず、それらのブームは終焉を迎えた。第1次AIブームの時代は、(ア)で問題を解く時代であった。しかし、それでは迷路やパズルといった(イ)しか解くことができず、適用範囲が狭いことが課題だった。第2次ブームでは、(ウ)が登場した。適用範囲は広がったが、知識を明示的な形で記述することの難しさがネックとなり、ブームは終焉した。

A) ディープラーニング
B) コグニティブコンピューティング
C) 機械学習
D) エキスパートシステム

> 003問の予想解答 

004問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
2012年、コンビュータによる物体認識の精度を競う国際コンテストImagenNet(ILSVRC)にてトロント大学のチームが開発したディープラーニングを利用したモデル(ア)が優勝した。(ア)が従来の認識精度を大幅に改善したことをきっかけにディープラーニングは注目を集め、さらに2015年にはMicrosoft社が開発し、スキップコネクション(Skip connection)を特徴とするモデル(イ)が人間に勝るとも劣らない認識率を示したと報告され大きな話題となった。

A) ResNet
B) AlexNet
C) ZFNet
D) VGGNet

> 004問の予想解答  

005問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
2012年、コンビュータによる物体認識の精度を競う国際コンテストImagenNet(ILSVRC)にてトロント大学のチームが開発したディープラーニングを利用したモデル(ア)が優勝した。(ア)が従来の認識精度を大幅に改善したことをきっかけにディープラーニングは注目を集め、さらに2015年にはMicrosoft社が開発し、スキップコネクション(Skip connection)を特徴とするモデル(イ)が人間に勝るとも劣らない認識率を示したと報告され大きな話題となった。

A) ResNet
B) AlexNet
C) ZFNet
D) VGGNet

> 005問の予想解答

 

006問

以下の文章を読み、空欄(ア)に最もよく当てはまる選岐を1つ選べ。
第3次のAIブームは、(ア)の時代であると言える。現在研究されている技術は第1次、第2次ブームの頃から継続して行われているものもあれば、(イ)のようにインターネットの発展とともに分析の対象となるデータ量が増え、ここ20年で大きく活用が進んだものもある。

A) 知識工学
B) 知識表現
C) 機械学習と深層学習
D) 汎用人工知能

> 006問の予想解答

 

007問

以下の文章を読み、空欄(イ)に最もよく当てはまる選岐を1つ選べ。
第3次のAIブームは、(ア)の時代であると言える。現在研究されている技術は第1次、第2次ブームの頃から継続して行われているものもあれば、(イ)のようにインターネットの発展とともに分析の対象となるデータ量が増え、ここ20年で大きく活用が進んだものもある。

A) 意味ネットワーク
B) 統計的自然言語処理
C) エキスパートンステム
D) 強いAI

> 007問の予想解答

 

008問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
人間が持つ知識をコンピュータに持たせようとするさまざまな研究が行われている。例えば、人間が日常的に使う言葉をコンピュータに処理させる技術を(ア)といい、知識処理に関わる研究が行われている。また、情報リソースに意味を付与することでコンピュータにより高度な意味処理を実現しようとする技術に(イ)がある。

A) 機械翻訳
B) 自然言語処理
C) 記述論理
D) セマンティック・ウェブ

> 008問の予想解答

 

009問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
人間が持つ知識をコンピュータに持たせようとするさまざまな研究が行われている。例えば、人間が日常的に使う言葉をコンピュータに処理させる技術を(ア)といい、知識処理に関わる研究が行われている。また、情報リソースに意味を付与することでコンピュータにより高度な意味処理を実現しようとする技術に(イ)がある。

A) 機械翻訳
B) 自然言語処理
C) 記述論理
D) セマンティック・ウェブ

> 009問の予想解答

 

010問

人工知能研究50年来のブレイクスルー」と称されるディープラーニングだが、その手法自体は第3次AIブームが盛り上がる以前から提案されていた。ここ数年になって急速な盛り上がりを見せているのにはいくつかの理由がある。以下から、その内容として最も不適切な選択肢を1つ選べ。

A) 大規模な並列計算処理が可能になったことで、現実的な時間内でモデルを学習させられるようになったから
B) より大規模なデータがウェブ上に公開されるようになり、データの収集が比較的容易になってきたから
C) プログラミングを支援するフレ一ムワークが広く普及したから
D) 経済産業省が第5世代コンピュータプロジェクトに巨額の資金を投じたから

> 010問の予想解答

 

001問の予想解答

B) 探索や推論
根拠:T.9

001問

002問の予想解答

C) トイプロブレム
根拠:T.9

> 002問

003問の予想解答

D) エキスパートシステム
根拠:T.9

> 003問 

004問の予想解答

B) AlexNet
根拠:T.163、T.188

> 004問

005問の予想解答

A) ResNet
根拠:T.164

> 005問

006問の予想解答

C) 機械学習と深層学習
根拠:T.10、T.80
補足:T.10では「第3次AIブームは『機械学習と特徴表現学習の時代』」となっていますが、T.80の「ディープラーニング(深層学習)は、『特徴表現学習』を行う機械学習アルゴリズム」とあるので、併せて考えれば上記の妥当性が言えるのではと思ってます。

> 006問

007問の予想解答

B) 統計的自然言語処理
根拠:T.50

> 007問

008問の予想解答

B) 自然言語処理
根拠:公式テキストや公式問題集にはストレートな記載は無いが、常識的知識から。例えばWikipediaにはこう書かれてます。

人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術

> 008問

009問の予想解答

D) セマンティック・ウェブ
根拠:X.202、XI.8-5

> 009問

010問の予想解答

D) 経済産業省が第5世代コンピュータプロジェクトに巨額の資金を投じたから
根拠:A)→T.127-130、B)→T.49-50。Cについては、公式テキストや公式問題集にはストレートな記載は無いが、常識的知識から。例えば、AI白書の解説

深層生成モデル、Generative Query Network(GQN)は第三次AIブームを引き起こしたディープラーニング応用の最前線…オープンなフレームワークが公開され、集合知のプラットフォームが形成されている。

とあるが、こうした文脈からも読み取れるのではないか。白書の中身まで追えてないので、時間が出来たら見てみたいな。。(ちなみに、実際の試験で解答する際に「経産省ディスるつもりはないけど、日本の一省庁の予算でこのブームが作れたなら、それはスゴすぎるw」と漏らしていた記憶が…(^_^;)>

2019/11/21追記
AI白書2019 (Kindle の位置No.3327-3334) には以下の記載がありました。

大手AI企業においては、機械学習ディープラーニングで用いられるフレームワークやライブラリをオープンソースソフトウェア(OSS)として公開しユーザーの集合知を集めたり、データやモデルやノウハウを参加者が自由に交換し互いに協力し合うエコシステムやプラットフォームを構築する動きがある(表291)。プラットフォームを利用することで、AIの最新研究成果を誰でも簡単に利用できる環境が整備されつつあり、いわゆる「AIの民主化」の一翼を企業活動の一環として担っているともいえる。

> 010問

注意事項

  • 上記記載は、あくまでも個人の自己採点と復習、それらによる理解の深化、記憶の定着を目的としています。
  • よって、上記記載に関して、誤謬や内容の間違いに限らず、ここから派生することも含めて一切の責任を負いかねます。
  • なお、参考にしていただくのは一向に構いませんし、色々と議論したり教え合ったりはむしろ歓迎いたします。率直に言えば、皆様に教えていただきたいですし、逆に少しでもお役に立てればという思いもございます。
  • あくまで、皆様の善意を前提としています。やはり、これらにより発生する事柄についても一切責任は負いかねますので、予めご了承ください。

凡例

記号 説明 具体例
T. 公式テキスト(Official Text)のページ T.9は公式テキストのページ9
X. 問題集(EXercise book)のページ X.10は問題集のページ10
XI. 問題集(EXercise book)の設問(Item)

XI.3-11は問題集の第3章の第11問

XI.8-12は問題集の第8章(総仕上げ問題)の第12問

     

鞍点と停留点

f:id:re_sweater:20191114230426j:plain

(cc) photo by odonata98 (Kimberly Reinhart)

G検定の公式テキストを読み進めると、勾配下降法の問題点の一つとして「鞍点(あんてん)」に出くわす。

鞍点と呼ばれるその点は、ある次元から見れば極小であるものの、別の次元から見ると極大になってしまっているもののこと

「まさに馬の鞍(くら)の形だ!確かに馬の背筋方向に勾配下降していくと、鞍の中心(鞍点)を極小解と勘違いしかねない」と目からウロコ。脳に刻まれるわけです。

 そしてG検定問題集の第5章(ディープラーニングの概要)第8問

ディープニューラルネットワークの学習において誤差を最小化する重みを求めたいが、(中略) (ウ)にトラップされてしまうという問題がある。

 で迷いなく(ウ)に「B.鞍点」を選んで解答をみると、

×(バッテン!)答えは停留点。鞍点は、停留点の一つです。

的なことが書いてあるではないか!

早く言ってよ~~~、公式テキストにはなかったやん。。。
って、なりませんでしたか?!

 

G検定2019#3を受験してみて。

忘れないうちに、受験で感じたことを、書き綴っておこうと思います。

時間配分

まず、時間について。試験前から時間的に余裕が無いことはわかっていました。120分で220~230問、つまり1問につき30秒ちょいのペースですからね。

それを意識したからか、「全然間に合わない」といった最悪の事態にはならずに済みました。全問終えて残り5分。数問見直すことができ、少なくとも1問は正解に修正できました。

前半は、結構な割合でネットで調べながら進めていました。それでも本人としてはピンポイント検索で1問30秒はかかっていないという感覚でした。ところが60分が過ぎたところでペースが悪いことを認識。後半の初見問題は、調査する余裕はほぼなくなりました。

出題内容

出題範囲はもちろんシラバスの範囲でしたが、未知の問題が特に前半戦で多く出てきたと感じました。個人的には特に自動運転関連や法制度関連で時間を費やした印象があります。

わたしは公式テキストG検定問題集を中心にやってきたのですが、それらに自動運転関連もしっかり載っていました。しかし、覚えるのが大変だし、当日出題されたら調べればいいかなと高をくくっていたのが失敗でした。特に時事問題や法律は、初見の読み込みにはある程度の時間を要します。話題になっているものは事前にチェックし、それでも初見の問題が出たらある程度割り切って対処する必要があるでしょう。

なお、公式テキスト/問題集で見た問題が、ほぼそのまま出題されていたケースもありました。やはり基本はこの二つですね。

難易度

個人的には、難-中-易でいう中程度かと思っています。実は解答しながら「わからない 問題」と「怪しい問題」を記録してゆきました。終わってみるとそれらの合計は40つでした。全226問でしたので、全体の17.7%になります。仮にこれら全問を間違え、ケアレスミスを少々加味しても、100点満点中80点前後にはなる計算です。

わたしは特別な勉強法をしたわけでも、多くの時間を費やしたわけでもありません。基本として、公式テキスト/問題集を繰り返し、その中で理解ができないところはネット調査で深掘りするということを徹底しただけでした(学習法については、別の機会に触れたいと思います)。

まとめ

今後受験される方に向けたアドバイスと言えばおこがましいですが(自分も再試験かもしれませんので、その自分にも向けて^^;)、何かの参考になればという気持ちで、まとめたいと思います。

  • 時間配分はやはり大事です。点数の取れる問題が後半にあるかもしれません。 全体を一通りこなせるような時間コントロールが大切 です。例えば、60分、90分等の節目にタイマーをセットし、その時点の目安の問題数を準備しておくと良いでしょう。
  • 出題内容ですが、やはり重要事項については「本質的な理解を問うてくる問題」になっています。例えば、ロジスティック回帰と尤度関数の関係(ロジスティック損失最小化 = 交差エントロピー誤差最小化 ≒ KL divergence最小化 ≒ 尤度関数最大化)の理解を求められる問題がありました。公式テキストの「ロジスティック回帰はシグモイド関数 or ソフトマックス関数を出力関数に」という丸暗記では、残念ながら対応できません。問題集にあった「対数オッズ」「ロジット変換」あたりからロジスティック回帰を深堀りしていれば、こうした問題への対応力が身についていたはずです。
  • 総合しますと難易度は、コツコツ基礎を理解してゆけば"中"(もしくは易という方もいらっしゃるでしょう)、暗記科目と勘違いしてしまうと"難"、といったところでしょうか。そうはいっても数学を基礎として成り立っている分野ですから、本質理解の積み上げが必要です。

 

【追伸】

コントロールが「コン」と「トロール」の間で自動改行されてしまいます。どうしたらよいのでしょう?ググって先輩たちの「>と<で括れ」というご指導を試しましたが解決できませんでした。。。

G検定 (ジェネラリスト検定) から始まった。

はじめまして、はてブロ初投稿です。

さて、実は先日 2019年11月9日にJDLAのG検定を受けました。オンライン検定なのに合格発表まで時間がかかるんだそうです。なので、まだまだハラハラしています。

このブログ、実はG検定勉強中に始めたいなと思ってました。でもその時は勉強に仕事に色々あって、なかなか時間が取れませんでした。検定も終わり一段落。時間もできたので、検定を振り返りながら、綴ってみようと思います。

テーマはAI全般にしようと思います。AIと広く捉えれば、実はこれまでも仕事で、部分的にかじってきました。推測統計、自然言語処理ビッグデータpythonも少々。でもここまで体系的に学んでなかったから、何も綴ることはなかった。でもG検定がこの”綴り”の機会をくれたんです。何か未来も繋がる予感もあります。ということで、感謝しながら綴り始めてゆきます。

よろしくどうぞ。m(_ _)m

www.jdla.org