圆栗子 发自 凹非寺

量子位 报导 | 大众号 QbitAI

一只手势辨认AI,怎样才算得上 (优) 秀啊?

不停地改换姿态,都能实时输出Emoji,大约是很秀了:



是护卫 (误) ,是来自《星际游览》瓦肯的举手礼。不大常用,做起来甚至有难度。

是好运,一般会两只手一同比。不过,也不是人类通用的手势。

即使这样,AI仍然机敏地辨认出来。而且,它是在浏览器上跑,也几乎没有延时

AI的爸爸,名字叫Nick Bourdakos (简称“尼克”) ,是来自IBM的程序猿

尼克把自己的调教效果发了推特,揽下2.8万赞


△ 666


尼克用的是TensorFlow.js,实时辨认毫无压力。

他把算法开源了,说咱们都能够试一试。

半小时就好

尼克说这个模型很简单,便是SSD-MobileNet

MobileNet是分类,SSD是方针检测,调配食用也是惯例办法。



他是用IBM云上的GPU练习的,免费的k80,半小时就练习好了。

在练习开端之前,要先预备数据:AI吃的是标示过的手势图

预备就绪,就来装置模型吧:

1$ npm install -g cloud-annotations

然后,能够开端练习了:

 1$ cacli
2┌─────────────────────────────┐
3│ (C)loud (A)nnotations (CLI) │
4│ version 1.0.12 │
5└─────────────────────────────┘
6
7Usage: cacli
8
9where is one of:
10 init Interactively create a config.yaml file
11 train Start a training run
12 logs Monitor the logs of a training run
13 progress Monitor the progress of a training run
14 list List all training runs
15 download Download a trained model
16
17cacli -h quick help on

当然,也不是非要用IBM云,也不是非要用GPU。拿CPU也能调教AI,大概要几小时吧。

练习完结,该在浏览器上跑了。GitHub项目里,自带了转换为TensorFlow.js模型的脚本。

把模型添加到React App里边。



最终,写一句nmp start,用浏览器翻开http://localhost:3000。

耶,这样就能够对着屏幕随意摇动手指了,你的AI会理解的:



当然,这只机敏的AI,才不是只能辨认手指。

喝点什么

只看你用什么样的数据去投喂AI了。

从前,尼克就帮AI修炼了分辩汽水的眼力。

第一题:一瓶雪碧,一瓶Canada Dry,都是绿色。



不论互换方位、仍是侧过瓶身,AI都不会被利诱。定格一看:



第二题:加大难度,两瓶都是Mountain Dew,一瓶一般一瓶低糖。

AI仍然分得清楚,坚决果断。



分辩手势,分辩汽水,都不失水准。

那么问题来了,你想让AI辨认什么呢?

想好了就开端调教吧,代码在这里:

https://github.com/cloud-annotations/training/

P.S. 推特谈论区,已经有小伙伴亲测成功,并表明Easy。


△ 再把辨认成果,显现成Emoji就完美了

诚挚招聘

量子位正在招募修改/记者,工作地点在北京中关村。等待有才华、有热心的同学参加咱们!相关细节,请在量子位大众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追寻AI技能和产品新动态

推荐阅读