AWS Certified Machine Learning – Specialty 受験記
当時のスペック
AWS関連
入社3年目で、AWS関連業務をやってました。
- 触ったサービスとしてはCLI, Cloudformation, Organization, CloudWatchなどです。
Solution architect - professionalを持ってました
機械学習(Machine learning)関連
業務で触ることはありません
社内講座で基礎講座を受講しました
- One-hot encodingなどの簡単な用語には「聞いたことある!」くらいになりました
個人的にも触りたいと思っていますが、なかなか…
「AWS Certified Machine Learning – Specialty」について
試験ガイドを参考にすると、4つの分野に分かれています
- 機械学習の流れで分野が分かれている気がします
- データ収集(分野1) → 前処理&分析(分野2) → モデル選び(分野3)と全般的なアーキテクチャ(分野4)
試験の内容
分野1:データエンジニアリング
1.1 機械学習のデータリポジトリの作成。
1.2 データ収集ソリューションの特定と実装。
1.3 データ変換ソリューションの特定と実装。
生データの収集、変換(加工)、保管についての内容です
機械学習の知識よりは、AWSアーキテクチャのにおいが強いです
なので、関連サービスの特徴を覚えておくことが大事です
- 例えば、Kinesis DatastreamとFirehoseの違い、どういう場合にとれか適合しているか
また、生データを収集 → 変換 → 保管の流れの設計例をしっておく必要があります。
分野2:探索的データ解析
2.1 モデリングのためのデータのサニタイズと準備。
2.2 特徴エンジニアリングの実施。
2.3 機械学習用データの分析と視覚化。
保管されたデータを分析し、パターンをみつけることについての内容です
サニタイズ(データの欠損値処理、ノイズ除去)が出てくるので、機械学習の知識が必要になってきます
- 手法の種類、特徴、処理方法
保管(S3とか)から視覚化(QuickSightなど)までの設計例を覚えておく必要があります
分野 3: モデリング
3.1 ビジネス上の課題を機械学習の課題として捉え直す。
3.2 特定の機械学習の課題に対する適切なモデルの選択。
3.3 機械学習モデルのトレーニング。
3.4 ハイパーパラメータの最適化の実施。
3.5 機械学習モデルの評価。
分析したデータをもとにどの学習モデルを選ぶかパラメータを設定するかの内容が出てきます
- Sagemakerを利用して学習するときの特徴などなど
分野 4: 機械学習の実装と運用
4.1 パフォーマンス、可用性、拡張性、回復性、フォールトトレランスを備えた機械学習ソリュ ーションの構築。
4.2 特定の課題に対応する適切な機械学習サービスおよび機能の推奨と実装。
4.3 機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。
4.4 機械学習ソリューションの展開と運用の実現。
Sagemakerを利用して学習するときの実装方法、運用アーキテクチャの内容になります
- AWSアーキテクチャのにおいが強くなります
AWS マネージドサービス(ForecastやRekognition)を選ぶこともあるので、簡単にサービスの内容を知っておく必要があります
勉強方法
Udemy講座を受講
ほぼ何もわからない状態だったので、(サルでもわかるように)教えてくれる先生が必要でした
講座は1万~2万のものが多いですが、結構な頻度でセールをします
- 2000円~4000円あたりになります
講座の購入基準
星が3.5以上(できれば4以上)
常に更新している&管理されている
- Last updatedを確認します
レビューを見る
- できるだけ最新日付ののレビューがあるか、レビューの数はどれくらいかを確認します
多くの講座が英語で提供ですが、字幕やスクリプトが提供されるので、グーグル先生の力を借りて勉強できます
私は「AWS Certified Machine Learning Specialty 2020 - Hands On!」を購入しました
模擬試験を受験
Udemyの模擬試験
こちらもセール期間を狙って購入しました。
- こっちは問題セット数も見てました。
英語ですが、繰り返し受験と解説がついてきます
私が購入した模擬試験は以下のものです
AWSの模擬試験
4000円+税です
過去に他のAWS資格に受かった場合はただで受けられるバウチャーがもらえます!
安心の日本語です
結果は各分野の正答率だけ。各問題の結果と解説はついていません
模擬試験が本番より難しいという噂もありますので、低い点数が出てもガッカリしなくても大丈夫です
- 私も結構悲惨な点数でしたw
その他
- 勉強期間は2週間くらいです
- 平日は家に戻ったら、講座を1時間程度見て、模擬試験を1個受講しました
- 週末は少しだけ模擬試験を眺めました
さあ、受験へ
受験場所
webカメラで受験者を監視、英語のチャットで指示を受けるというテストセンターもあるようですが、私が受けたところは普通にPCで受験するようなところでした。(部屋はカメラで監視されていましたが)
試験について
170分、約80問です。
紙に書いて簡単に計算しないといけない問題が、1,2問で出てきます
AWSサンプル問題では、機械学習の知識が必要な問題が5割?くらいでしたが、実際ではそこまで多くなかったイメージです。
30分くらい残して全問題解いて、残りの時間は問題を見直してました
結果&感想
- ギリギリのギリギリ合格でした。
- 自信あった「分野1:データエンジニアリング」が再学習の必要ありなのがちょっと意外でした。
- 3年後にはもうちょっと高い点数で更新したいです!