re:sweater

知識のrecycle精神で、warmyにAI世界を渉りたい。そう願いながらAI界隈やらを綴ります。

G検定2019#3自己採点061−070

前回に引き続き、2019年11月9日に行われたJDLA ジェネラリスト検定の自己採点をしていきたいと思います。226問まで、まだまだ…。

061問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
AIの生成物の代表的な例である。学習済みモデルをいかにして保護するのか、どのようなものが保護されうるのかということも議論の対象になっている。特に解釈が難しいものの1つに、ネットワーク構造とパラメータがブラックボックス化してしまい人間が外からは観察できない状態のモデルを利用して他のタスクに転用する新しいモデルを作成した場合、すなわちいわゆる(ア) がある。著作権による保護は非常に困難であるとされているが、特許法については保護の可能性があるのではないかとされている。

A) 進化モデル
B) 転用モデル
C) 派生モデル
D) 蒸留モデル

> 061問の予想解答

062問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
2019年3月、日本政府は、「人間中心のAI 社会原則」を取りまとめた。これは、AIの発展に伴って、我が国が目指すべき社会の姿、多国間の枠組み、国や地方の行政府が目指すべき方向を示すものである。この枠組みの中の戦略として(ア)が取りまとめられた(ア)の中では例えば年間(約100万人卒/年)のすべての(イ)にデータサイエンス・AIの基礎となる理数素養や基本的情報知識を習得させることなど具体的な数値目標も定めている。

A) デジタル・トランスフォーメーション戦略2019
B) Society 5.0戦略2019
C) AI戦略 2019
D) 人工知能技術戦略2019

> 062問の予想解答

063問

以下の文章を読み、空欄(イ)に最もよく当てはまる選択肢を1つ選べ。
2019年3月、日本政府は、「人間中心の AI 社会原則」を取りまとめた。これは、AIの発展に伴って、我が国が目指すべき社会の姿、多国間の枠組み、国や地方の行政府が目指すべき方向を示すものである。この枠組みの中の観として(ア)が取りまとめられた、(ア)の中では例えば年間(約100万人卒/年)のすべての(イ)にデータサイエンス・AIの基礎となる理数素養や基本的情報知識を習得させることなど具体的な数値目標も定めている。

A) 高等学校卒業生
B) 中学校卒業生
C) 高専卒業生
D) 大学・高専

> 063問の予想解答

064問

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。
フレーム問題とは人工知能の課題の1つで、現在の人工知能の情報処理能力の範囲では、現実に起こりうるすべての事に対して計算をもって人間のように対処することはできないとされる。例えばチャットボットに最新の言語処理手法である(ア)を実装して実際の人間とチャットをさせたとしても、(ア)は単語と単語や節と肌の相関性などは計算しても、人間が発話する時に関連付けられる要素、体験、知覚、時間軸や自己の年齢、趣味端好、目的などの現実のあらゆる情報、フレーム外の情報について計算してはいない。例え結果として機械が人間と同じ言葉を発話したとしても人間と同じように認識した結果ではないということは重要である。

A) NLP
B) BERT
C) Dropout
D) Fulfillment

> 064問の予想解答

065問

機械学習はしばしば差別的な判断を下してしまう可能性がある。
例えば、機械翻訳の際に性差のない三人称を勝手に男性と判断してしまったり、採用・不採用の判別の際に、学歴や人種で差が大きくなってしまうことである。このような AIの不平等が起こる原因として、最も不適切な選択肢を1つ選べ。

A) データをサンプリングする際に、インターネットを使用できる環境下のみでデータ収集を行った。
B) データのラベル付けを一人で行った。
C) 学習をする際に入手でモデルのパラメータを操作した。
D) 多くのデータで学習できるように、画像に回転や移動を加えデータを増やした。

> 065問の予想解答

066問

データをもとにモデルを生成する際の著作権法の規制に関する説明である。
文中の数字で始まる4文のうち、正しい説明文の行頭数字として最も適切な選択肢を1つ選べ。
学習済みモデル生成のためには大量の生データや生データを元に生成した学習用データセットが必要となる。その際、他人の著作物である生データを利用することも多くある。この場合、著作権者の許諾を得る必要があるのが原則である。

A) 1. この理由は、データをコピーしたり、機械学習に用いたりする行為が著作物の「公衆送信」に該当するからである。しかし、著作権法上、モデル生成のための他人の著作物利用が許諾なく可能な形外的な場合が規定されている。(30条の4)
この例外規定では、情報解析のためであれば、他人の著作物を許諾なく利用することが認められている。この例外規定に基づくと、例えば、
B) 2. 特定の事業者で構成される団体において、学習用データセットを共有する行為が認められることになる。しかし、この例外規定によっても、
C) 3. モデル生成を行う他人のために学習用データセットを作成して不特定多数の第三者に販売する行為は認められない。こうした著作権法の30条の4のような規定は、
D) 4. 世界の主要国においては既に整備済みであり、この規定の整備によって日本の著作権法が世界の標準レベルに近づいたと評価できる。

> 066問の予想解答

067問

論文に示されている方法を検証しようとしても同じ結果が出てこない、または結果の再現が難しい「再現性の危機」問題に関する説明として、最も不適切な選択肢を1つ選べ。

A) 問題の背景として、アルゴリズムを検証するために必要な訓練データが、論文に含まれていない場合が多いことが指摘されている。
B) この問題は、機械学習分野における競争激化の負の側面だという分析がある。
C) 「再現性の危機」は、機械学習分野に特有の課題であり、科学全般の問題ではない。
D) アメリカの国防総省の研究開発部門(DARPA)は、再現性を検証するプロジェクトの一環として、論文の信頼度をスコアリングするシステムを開発している。
E) 「再現性」について、研究開発者コミュニティでも、明確な定義や合意はない。

> 067問の予想解答

068問

教師あり学習の手法と関連が高いと考えられるものとして、最も適切な選択肢を1つ選べ。

A) エージェントが自身の報酬を最大化するような行動指針を獲得する
B) データに共通する特徴的な構造や法則を見つけることを目的とする
C) 一部のサンプルに対してのみ正解ラベルを付与することで、教師あり学習の精度を向上させることを目的とする
D) 正解ラベルが未知であるサンプルに対して正解ラベルを予測するモデルを生成する

> 068問の予想解答

069問

教師なし学習の手法と関連が高いと考えられるものとして、最も適切な選択肢を1つ選べ。

A) エージェントが自身の報酬を最大化するような行動指針を獲得する
B) データに共通する特徴的な構造や法則を見つけることを目的とする
C) 一部のサンプルに対してのみ正解ラベルを付与することで、教師あり学習の精度を向上させることを目的とする
D) 正解ラベルが未知であるサンプルに対して正解ラベルを予測するモデルを生成する

> 069問の予想解答

070問

強化学習の手法と関連が高いと考えられるものとして、最も適切な選択肢を1つ選べ。

A) エージェントが自身の報酬を最大化するような行動指針を獲得する
B) データに共通する特徴的な構造や法則を見つけることを目的とする
C) 一部のサンプルに対してのみ正解ラベルを付与することで、教師あり学習の精度を向上させることを目的とする
D) 正解ラベルが未知であるサンプルに対して正解ラベルを予測するモデルを生成す

> 070問の予想解答

 

061問の予想解答

D) 蒸留モデル
根拠:特許法による保護の可能性については、AI白書2019Kindleの位置No.6777)にこうありました。

特許権
・学習済みモデルが特許権で保護された場合には、元の学習済みモデルと「蒸留モデル」及び「派生モデル」との関連性が立証できるか否かにかかわらず、これらのモデルが特許発明の技術的範囲に属することを立証できれば、これらへの権利行使が可能。

「派生モデル」と「蒸留モデル」の違いについては、知的財産戦略本部の資料「新たな情報財検討委員会報告書(案)」にこうありました。

・派生モデル
学習済みモデルに新たなデータを用いて更に学習させることで、パラメータが変化し、精度を高めるなど異なる結果を生じる別の学習済みモデルを作成することができるが、このモデルを「派生モデル」と呼称することとする。
・蒸留モデル
ネットワークの構造とパラメータが外から見えない状況(ブラックボックス化された状況)でも、学習済みモデルにデータの入出力を繰り返すことで得られる結果を基に学習すれば、1から学習済みモデルを作成するよりも効率的に同様のタスクを処理する別の学習済みモデルを作成することができるこれは「蒸留(distillation)」と呼称されており、本検討委員会では、蒸留により作成された学習済みモデルを「蒸留モデル」と呼称することとする。

>061問

062問の予想解答

C) AI戦略 2019
根拠:「AI戦略2019資料」のp.2に以下の記載を見つけました。

(C)戦略の背景となる理念
2019 年3月、政府は、「人間中心のAI社会原則」を取りまとめた。

ここでいう「戦略」とは「AI戦略2019」そのものですので、その背景が「人間中心のAI社会原則」。つまり「AI戦略2019」は「人間中心のAI社会原則」の枠組みの中の戦略と言えると判断しました。なお、「Society 5.0」との関係については、同資料p.2に

(B)戦略の目的
本戦略の目的は、Society 5.0 の実現を通じて世界規模の課題の解決に貢献するとともに、我が国自
身の社会課題も克服するために、今後のAIの利活用の環境整備・方策を示すことである。

とあるので、「Society 5.0」は「AI戦略2019」の目的にあたるものと言えます。

> 062問

063問の予想解答

A) 高等学校卒業生
根拠:「AI戦略2019資料」のp.9に以下の記載を見つけました。

全ての高等学校卒業生(約 100 万人卒/年)が、データサイエンス・AIの基礎となる理数素養や基本的情報知識を習得。また、人文学・社会科学系の知識、新たな社会の在り方や製品・サービスのデザイン等に向けた問題発見・解決学習を体験

> 063問

064問の予想解答

B) BERT
根拠:Google最新技術「BERT」と「東ロボ」との比較から見えてくるAIの課題 (2018年11月23日) - エキサイトニュースに記載の内容を総合すると「BERTをもってしてもフレーム問題は超えられていない」という問題文と同趣旨の内容が読み取れると思います。

自己採点✕:BERTを認識してなかったので「A) NLP」を選んでしまいました。

> 064問

065問の予想解答

D) 多くのデータで学習できるように、画像に回転や移動を加えデータを増やした。
根拠:総務省「AI利活用原則の各論点に対する詳説」のp.9にこうありました。

機械学習においては、以下の方法によりデータの質を確保することが考えられる。
(中略)
[学習時の対策(例)]
(中略)
• 学習の精度を上げるため、特定のデータを拡張した上で学習を行う。

自己採点✕:A)を選んでしまいました。初見の問題だったので割り切って直感で「エイッ」でしたw

> 065問

066問の予想解答

A) 1.
根拠:全選択肢(A〜D)について検証します。

A)→ AI白書2019Kindleの位置No.6745)

我が国の著作権法は、同条により、コンピューター等を用いた情報解析のために行われる複製等を許容する権利制限規定を有している。具体的には、コンピューターによる情報解析を目的とする場合に限り、元となるデータに第三者の著作物が含まれている場合であっても、必要と認められる限度において著作物を記録または翻案し、学習用データを作成することができる

(A)のつづき)AI白書2019Kindleの位置No.6755)

平成30年の著作権法改正により、同法47条の7(2019年1月1日以降、同法30条の4第2号)は、様々な機械学習に対応できるように、その適用範囲が拡大された。具体的には、コンピューターを用いない情報解析も含まれることになるとともに、自ら解析を行う場合のみならず、情報解析を行う他人のためにAI開発用データセットを作成することや、解析終了後のデータセットを情報解析する他人に送信することも可能になる。同条は、現状でもすでにAI開発や機械学習の発展にとって極めて有用なものであったが、今回の改正によって、さらなる拡充が図られたため、将来的にますますイノベーションの促進が期待されるところである。

B)→ 進化する機械学習パラダイス ~改正著作権法が日本のAI開発をさらに加速する~ | STORIA法律事務所にこうありました。

現47条の7の限界
ただ、現47条の7は、あくまで生データ収集、データベース作成、学習用データセット作成、機械学習、DLを同一の事業者が一連の流れとして行う場合のみにしか適用されません。
これは、47条の7で許容されている行為が「記録媒体への記録・翻案」のみであること、47条の10(複製権の制限により作成された複製物の譲渡)に47条の7が含まれていないことから導かれる結論です。
したがって、以下のようなケースにおいては現47条の7は適用されず、原則に戻って、著作権者の同意なく行った場合には著作権侵害となります。
(中略)
3 特定の事業者で構成されるコンソーシアム内で、学習用データセットを共有する行為
例:深層学習を利用した自動翻訳エンジンを生成する事業者が、WEB上の自然言語データを大量に収集して生成した対訳コーパスを、事業者団体内部で相互に共有するケース

C)→ T.288

自分で作った学習用データを第三者(例えば共同研究者)と共有したり、一般に販売したり、ネット上で公開したりすることも、一定の条件下で適法となっています。

D)→ T.288

日本の著作権法では、「情報解析を行うために著作権を複製すること」が、営利・非営利を問わず適法とされており、世界的に見ても先進的と言われています。

またA)で引用したAI白書2019Kindleの位置No.6745)にも「情報解析が営利目的であっても適用される点で、諸外国の規定よりも適用範囲が広いといえる。」とある。

> 066問

067問の予想解答

C) 「再現性の危機」は、機械学習分野に特有の課題であり、科学全般の問題ではない
根拠:再現性の危機 - Wikipedia

> 067問

068問の予想解答

D) 正解ラベルが未知であるサンプルに対して正解ラベルを予測するモデルを生成する
根拠:T.94-95、X.40、X.42(近い表現)、XI.2-1、XI.2-3

> 068問

069問の予想解答

B) データに共通する特徴的な構造や法則を見つけることを目的とする
根拠:T.95(近い表現)X.40-41、XI.2-1、XI.2-2

> 069問

070問の予想解答

A) エージェントが自身の報酬を最大化するような行動指針を獲得する
根拠:T.174、XI.2-4(ほぼそのままの表現)

> 070問

注意事項

凡例

次へ