dotnetrocksのTranscribeにチャレンジ!

まだFirst Draftです。

元ネタはこれです。 https://www.dotnetrocks.com/default.aspx?showNum=1112
今年三月の放送。ゲストはTim Huckbyさん。Kinectの話でいつもゲストになる方です

日本でKinectはゲーム機ととらえてて、商用(または私が見たい医療用)にあまり使われていない、という感じがしたし、そんな認知度のはなしを 今週きいたので、やってみました。

ご本人たちの承認とか、分かりにくいところの言い換えとか、今週末中にやること。

まず前半。(リスナーの投稿とか、CarlとRichardのBetter Know Frameworkは飛ばして、ゲストインタビューのみ)

--------------------------------

Tim Huckby を紹介するよ。彼は.netrocksの初期からのゲストってだけではなく、NUIやタッチやジェスチャやニューロインターフェースの業界での最先端の方向づけたる一人者だ。
や、Mr. Huckby 調子はどう?

Tim: まずまずやってる、そっちはどう?
Carl: 未来に畏まってるよ。
Tim: 何から話そう?Hololenseの話?emotivヘッドセットの話? 
Carl: 未来のことは話したからさ、現在の話どう?Kinect for Windows v2?

Tim: やー。ちょっとした騒ぎがあってね最近それで。あまりネガティブなことは言いたくなかったんだけど・・・Kinectが今、在庫切れてるって知ってる?
Carl: え。知らなかった!

Tim: Microsoftのコンシューマ部門が、一時的にKinectv2のセンサー在庫切れで、Windows用のだけの話じゃなくて、xboxにも影響してんだよね。僕ら、大きなデモをするつもりで、Kinectたくさん必要だったんだけど、このおかげで大変だったよ。
三月末にはまた在庫来るみたいなんだけど。
まあそれは悪いニュースだったんだけど、いいニュースは、僕らはこの200ドルのデバイスに投資しつづけて、僕らのエンジニアはすごいことを開発しつづけてるんだ。
Carl: Tim、まだKinect for Windowsがもうないってこと言ってなかったね。xbox用のコントローラと40ドルのアダプタを使わないといけないんだっけ?

Tim: アダプタはMSの在庫にあるんだけど、センサーの在庫がないんだって。
  それだけど、MSはその方が都合がいいんだ。だってxbox用のとまったく同じだし、USBのアダプタでwin機にさしてるだけだから。
Carl: emotiv と Tan Leと、彼女がどれだけ凄いかの話はしたからさ・・・あ、そうそう。emotiv は 2nd generation の話が出てるんだけど、まだ発売されてないんだ、で出資者たちの間でいろいろ話になっててさ・・・。

Tim: そうなんだ。それは知らなかったよ。僕はひと月に一度チェックするぐらいだから。 あ、で君がさっき言ってた(視聴者からの投稿で、テレビのコントローラーが思考でできるようになって、さらに飽きてきたと検知するとテレビが勝手にチャンネルを変える「カウチポテト」技術の話) 話って、全然あり得るよ。 僕たちは10年以内に命令が思考で飛ばせるようになるだろうよ。
僕の夢は車いすを思考で動かすことなんだ。 でも 感情をトラックすることはけっこう大きな仕事でね。

Carl: それもうやってるよ!ビデオでemotivと車いすでコントロールしているの見た! 
Tim: でもその最後でさ、使用者がパニクちゃったじゃん。コントロールはちゃんとできないんだ。 それはたぶんUse Caseの最終到達点だろうね。 Emotivは感情トラッキングだと思うんだけど、それはたとえば、エンジニアが音楽を聴きながらコード書いてて、どんな風に感じているかとか、それがどう使えるかってのが、利用価値があるんじゃないかな? 
完全に人間の脳がコマンドにマッピングされるまでは、そうやって間接的な技術が必要だよね。

Carl:
それでね、みんなこの一つのデバイス見て全部を解決しようとするけど、たとえばその間に視線をトラッキングして、で、思考コントロールと一緒に制御して、つまりもう一つレイヤを重ねる形にするのはどうだろう。「本当に、その命令を投げたい?」って。 じゃないと気まぐれで考えたことが現実になって、バカなことが起こっちゃうからね。

Tim: 君がソフトウェア的に解決するって話をもってきたんで言っちゃうと、僕らは感情トラッキングを「幸せ」かどうかって判別するとこまではやってんだ。で「幸せ」だと感知したときに、何かの広告を投げると。CPGとかブランドにとっては、すごく重要なことなんだ。
あ、ブランドってのは、ペリエとか、クリネックスとかCokeとかPepsiとか何でもいい。CPGってのは Consumer Packaged Goods(消費者向けパッケージ商品)
で、僕らはそんな会社とKinectを使ったビジネスについてどうやってクーポンを投げるか話しているんだけど、一番注目されているのは人種性別年齢によって変える広告を激安で実現することなんだ。 Kinectって200ドルだけど、僕らは3年費やして技術者が三角関数とか、積分とかやって、人種と性別と年齢を見分けることができるようになった。
で、面白いのは、彼ら(ブランド)は僕や君やRichardなんか興味ないんだ。ミレニアム世代にCPGが注目している。 しかも人種もどうだっていいんだ。世界はどんどん混血していって、茶色化しているからね。 ちなみにこの混血ってのがすごく人種トラッキングには難しいんだけど、ブランド側はもうどうでもよくなってきている。20年前はそうじゃなかったけど。
まあ、ある程度例外があって、世界の中には地域的に一人種だけがマーケットに影響するってポケットになってるところもあるけど。

ロスアンゼルスなんかそうだよね。ヒスパニックの中流家庭のミレニアム世代が一番、マーケットに影響を与えてるから、彼らにターゲットを絞って広告するんだ。ダイエットペプシとか。Kinectを使ってね。

Richard: で、Kinectで何を見てるの? ほぼ棒人間にしか見えないんだけど?

Tim: はは、Carlも笑うよね。そうそう。スケルトントラッキングが一番楽にできるところで、.Netの講習でもいつもスケルトンから入る。 Carlのジェスチャーパックもつかってね。でも、Kinectは他の機能もすごくて、Infraredと深度センサーカメラが特にね、それを組み合わせたりとか。
Kinectって、基本的にデータを投げてて、人間側が反応しているだけなんだ。で、複数のカメラを使えば、どこに人間がいるのかわかって、新しいのだと30フィート内にいる人間が分かる。それだと一番近い人間がだれかもわかるし、どこに顔があるかってのもわかる。それで、路上とかで顔写真をとることもできるんだね。で、そのデータをクラウドに2Dであげて、Azureでも何でもいいけど、そこにあるFunctionとかサービスで三角関数使ってそのプロファイルを3Dモデルに持ってくんだ。人種性別年齢別のプロファイルにね。で、そのデータをリアルタイムに顧客にもどす。

Carl: ねえ、ドアの前に来る宗教勧誘の人種性別年齢をとったりすることもできたらいいよね。

Tim:ははは。もしその宗教が同じ格好して、同じ本を同じ側の手にもっていたら、できるよね!

もっと、現実的な利用法の話をしよう。 うちの分社で、透明の冷蔵庫を作っているんだ。でそのドアはタッチスクリーンになっている。そこで、広告とか、ゲームとか流せるよね。で、Kinectを使って誰かが近くに来たら、透明のドアに戻すんだ。それで何が入っているか分かるからね。 (訳注: 米国の食料品店頭での冷蔵庫の話ですねこれ) 僕はライ豆を探しているときにCokeの宣伝なんか見たくないし、それでコーンや緑豆とか見えなくなっちゃうのヤだし。

そもそも、人種性別年齢のトラッキングは本当に面白いんだ。北米ではもうプライバシーなんてなくなっちゃってんじゃん?別に君が誰だかを知らなくてもいいんだけど、君がミレニアム世代の男性かどうかは知りたいんだ。そしたら、的を絞ってエナジードリンクの広告を見せることができる。エナジードリンクのマーケットは凄い大きいんだよ。ミレニアム世代男性をターゲットにしててね。
もちろんミレニアム世代って誰だって話だけど、まあ、僕たちの半分の年齢だよね(笑) 子供たちの話。

Carl: じゃさ、君のアルゴリズムだと、年齢が分かっちゃうの?
Tim: うん。正確にね。 今までもそういうの会ったけど、あまり正確ではなかった。 僕らのは正確だよ。とはいってもブランドが気にするのはミレニアム世代だから、それって10歳の年齢範囲があるけど。
でも僕らは5歳の誤差で判別できる。もちろんよーーーーく見ないといけないけど。

Carl: じゃ、僕がカメラの前に行くと、体重計と減量ピルとセロリの広告を見せられるわけだ!(訳者注:Carlの外見はリンク元参照。トップバナーの右側の人です) 

Tim: ははは。そうだ。僕らのデモの中で、凄い人気あるのがあってね。トップFortuneのCEOにも大人気だったんだけど・・・人種性別年齢の判別プログラムでは、僕は50代男性として、それもどのくらいのレベルで自信もって言えるか、の正確性レベルつきで出るんだけど、それにはバニティ(美化)モードってのがあってね。 チートなんだけど、そのメトリクスだと、君を20代でハンサムって判別することができるんだ!

Carl:すげえ!それやりたい!!
Tim: 了解!

Richard: キモイ、って反応はないの?
Tim: もっちろんあるよ! 沢山! まだ個人判別のところまで話してないよね。
Carl: そうそう、まだキモイ話はしてない。
Tim: エンジニア達が作る技術は凄いんだけど、プライバシー法ってのがあるからね。 もし、僕が消費者で、Nordstrom(アメリカの大手の高級服飾品デパート)のウェブサイトで、お客様の動きをトラッキングしていいか?なんて訊かれたら、絶対!絶対!イエスとは言わない。
誰がイエスっていうとおもう? うちのカミさんだよ! だって40%オフだよ?子供の靴が! 

まだ顔認識とか顔によるアイデンティティの話はしてないよね。これって実は人種性別年齢によるアイデンティティよりは簡単なんだ。いくつかの顔写真の平均値を出しすパターンはもうできているし。
これってけっこうパワフルなもので、たとえばRichardがザック(リチャードの犬) をつれて毎朝散歩のついでに近くのセブンイレブンに行くとするよね。この技術で簡単に「リチャードはここに来たことがある」って判別することができる。 またその上に「リチャードは、Cokeをいつも買う」ってことも言える。

近未来的に、小売系のCPGとかブランドのCEOがやりたいのは、僕のカミさんをNordstromでトラッキングして、カミさんが何を買うのか、何を買わないのかってのを知る、でその上でカミさんが2回見て買わなかったら、何かインセンティブを彼女に与えてどうにか買ってもらおうとする、ってところなんだ。

Carl: ねえ、リチャード。今何時だと思う?
Riart: ああ。ハッピータイムだね
(ここで、視聴者プレゼントと、ゲストが5000ドルを与えられたら、どんなGeekなものを買うか?という小休止コーナー)
============================

私も小休止。
土曜日の朝のうちに半分いきました。続きは明日かな?







Popular posts from this blog

北穂高(ソロキャン)

奥穂高 岳沢~重太郎新道コース ソロ

ヤビツ~塔の岳~大倉 グル登山