7/25のユーザコミュニティの勉強会で、Project Oxford について紹介するセッションをやってきました。
勉強会のテーマが、Azure Machine Learning で、すでにML Studio を使ってぐにゅぐにゅする系のセッションがありましたので、自分はML Studio を使わずに、参加者が独自で作るのがちょっと難しいようなAPI を紹介できればなーって思い、Project Oxford の紹介にしました。
ってことで、使ったセッション資料
Project Oxford
Microsoft のサイトで、機械学習 API を公開しています。
今あるのは、下記の4つです。詳しくは、Document コンテンツを見てください。
これらのAPI は REST な API ですので、独自のアプリから呼び出すことができます。
Face APIs(Beta)
画像から人の顔を検出して、年齢とか性別とかを予想します。
画像認証とかにも使える分野みたいな感じですかねー。
Speeach APIs(Beta)
音声ファイルから人の話し声を抽出して、その内容を文字列にしてテキスト化するなんて感じに使えそうです。
Computer Vision APIs(Beta)
Vision APIsは、個人的に今一番面白と思ってます。
画像を読み取り分析するという意味では Face APIs と似てますが、画像のカテゴリ解析(人、動物、景色、乗り物とか)や、アダルトコンテンツの判定、写真or絵画の判定などなどが出来ます。
また、OCR のように、画像から文字を検出してテキスト化することもできます。
Language Understanding Intelligent Service(LUIS)
Invite しないと使えないのでちょっとわかってないのですが、Cortana とかに使われてる感じなのかな??
Betaとなっているものは、各 API Reference で、テスト的に動かすことができます。
実行結果のJSON形式のデータも見れるので、わかりやすいと思います。
ただし、実行するにはAzure の MARKETPLACE で購入する必要があります。
購入といっても、BETA なので無料ですけどね。
Azure MARKETPLACE での購入
下記のような手順です。簡単なので、画像を順番に貼り付けただけですだけ。
資料について
パトレイバーのくだりは、ぶっちゃけいうと自分の趣味な世界なんですが、ML を知ったときに、ピースメーカーの「ニューロン・ネットワーク・システム」が最初に頭に浮かんじゃったんですよね。
ってことをネタに、どういう制御したんだろうって妄想をしたのが、今回のセッションのベースです。
そこから、画像解析が発達したら障害物の検知とかもできるのかなーって思ったのです。
画像解析で、年齢とから性別とかわかって何が面白いのかなって思って部分は正直あるのですが、画像解析をすすめるとこんな制御の入力情報になるのかもしれないって思えたのは、今回のセッションを考えた中で、一番の自分の成果かもw
(注)
ちなみに、自分はデバイス周りの専門家では全くないので、現実的には違うのかもしれないし、すでにできている世界なのかもしれませんが、素人考えで障害物を検知するには見るしかないじゃんから発想したレベルです。
で、セッションをやってみて思うのは、MLもクラウドと同様に、これまで個人ではどうやっても開発できなかったサービスが開発できる技術の1つになるように感じでいます。
今のうちにいろいろ試して、頭を柔らかくしておくと、次のステップが楽になるかもしれないと思います。
コメント