Amazon SageMakerってどんなもの?何ができていくらかかるの?
sageMakerとは?
簡単に書くと、ノートブックに書いた機械学習モデルをそのままデプロイしてホスティングできるサービスです。
これってすごい便利ですよね。
弊社では、今まで、ノートブックで書いたモデルを、いちいちアプリケーション化して、さらにデプロイするためにPMMLに変換したりと、めちゃくちゃ非効率に業務を行なっていました。
このツールを使うことで大きな時間の節約になりそうです。
っていうか今までなんでこういうの使ってなかったんだろう…。
Amazon SageMaker は、完全マネージド型の機械学習サービスです。Amazon SageMaker では、データサイエンティストと開発者が素早く簡単に機械学習モデルの構築と研修を行うことができ、稼働準備が整ったホスト型環境に直接デプロイできます。統合された Jupyter オーサリングノートブックインスタンスから、調査および分析用のデータソースに簡単にアクセスできるため、サーバーを管理する必要がありません。また、一般的な機械学習アルゴリズムも使用できます。そうしたアルゴリズムは、分散環境できわめて大容量のデータに対しても効率良く実行できるよう最適化されています。自前のアルゴリズムやフレームワークもネイティブでサポートされているため、Amazon SageMaker ではお客様固有のワークフローに合わせて調整できる柔軟性の高い分散型トレーニングも行えます。Amazon SageMaker コンソールからクリック 1 つで起動して、安全でスケーラブルな環境にモデルをデプロイします。トレーニングとホスティングは、分ごとの使用量で課金されます。最低料金や前払いの義務はありません。
使い方
ドキュメントがすでに日本語化されている。
このドキュメントを読めばOK。1hくらい時間をとって読めばだいたいどんなものか理解できる。
https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/gs.html
料金について
いくらかかるのかも調べてみました。
無料使用枠
申し込みから最初の2ヶ月は無料で使えるみたい
AWS 無料利用枠の一環として、Amazon SageMaker の使用を無料で開始できます。申し込み後最初の 2 か月間は、モデル構築用に t2.medium ノートブックの使用 250 時間の無料枠があり、加えてトレーニングに m4.xlarge を 50 時間、機械学習モデルの Amazon SageMaker でのホスティングに m4.xlarge を125 時間使えます。
MLインスタンスの料金
Jupyter ノートブックの実行環境や、モデルの学習、モデルのホスティングのためのインスタンスの料金がかかる。
料金は使った分だけしかかからない。
開発者ガイドを試してみたが、下記の3つは別々のインスタンスだった。(ちなみにEC2とは別の管理だった。)
- ノートブックインスタンス(モデルの構築)
- トレーニングインスタンス(モデルの学習)
- ホスティングインスタンス(モデルのホスティング)
1に関しては実態は、Jupyter ノートブックなので、あまり性能は高くなくても良い。
2に関してはより高い方が計算に時間のかかるものの場合よい。(c4系がよさそう)
3についてもあまり、高い性能はなくても良さそうだがドキュメントではm4系で指定されてた
性能の低いインスタンスであれば 10円 / 1h もかからない。(そもそもml.t2.medium
は最初の2ヶ月は250時間まで無料)
詳しい金額は下記のリンクに記載してあります。料金の例など参考になります。
https://aws.amazon.com/jp/sagemaker/pricing/
ストレージ分の料金
こちらもプラスでかかるようだけど、極端な使い方をしなければまず、あまり気にしなくて良さそう。
活用方法
notebookのインスタンス作成からモデルの演算、デプロイまでのフローを1プロダクトでできるというのは便利。
単純にnotebookだけ使う目的でも使えそう。使わないときはstopしておけばよいし。
かなり便利なツールだと思います。