用微信扫一扫

0号课堂

最新活动

资讯前线

腾讯云王磊 : AI应用的落地大幕已拉开……

2018年4月18日下午,由鲲云科技协办的“制造业与互联网融合发展深度行(深圳站)暨2018年全球人工智能应用创新峰会”在五洲宾馆隆重举行。

 

2018年4月18日下午,由鲲云科技协办的“制造业与互联网融合发展深度行(深圳站)暨2018年全球人工智能应用创新峰会”在五洲宾馆隆重举行。

出席本次峰会并进行分享的专家学者包括:

人工智能领域国际权威Prof.Wayne Luk (陆永青)、Prof.Steve Furber、Prof. Arvind、Prof. Kunle Olukotun、杨广文教授、Prof. Derek Chiou、鲲云科技创人CEO牛昕宇,星瀚资本创始合伙人杨歌,腾讯云人工智能产品总监王磊和天津大学微电子系副院长刘强教授等。

腾讯云人工智能产品总监王磊在峰会上就腾讯在人工智能领域的探索和创新进行了经验分享。他将腾讯云在AI方面的布局、应用和已经落地的案例做了分享,并且指出AI应用包括AI本身,现在才刚刚开始,腾讯,腾讯云在这块是非常开放的心态,愿意和所有的合作伙伴一起去抓住这一波风口。

以下为演讲实录,由善缘街0号整理,略有删减。

腾讯云AI能力矩阵

我们把AI能力分四类,第一类是大家现在非常熟知的人脸识别类。在人脸识别类里,最基础的是人脸检测、人脸追踪。到后面新的玩法是人脸融合、聚类,包括对于现在很常用的技术,有一比一的人脸识别,也有一比N的人脸识别,包括活体检测技术。

第二类是图象识别,图象识别类里大致分为图片标签分类、图片内容审核。比如色情/暴恐识别,车辆识别包括对事件检测。

第三类是文字识别类,主要是做光学字符识别,比如名片、身份证、驾驶证、行驶证、营业执照、发票,还包括腾讯的手写体识别。

第四类是语音和自然语言处理类识别,包含语音识别、语音合成、声纹识别、机器翻译。像腾讯翻译机、自动客服、人机交互,这些都是腾讯在人工智能应用方面开放出来的能力,是一个比较完整的能力矩阵。

基于这个基础我们做了一些尝试和探索。

AI应用产品

腾讯云人工智能应用的矩阵聚焦在三大核心方向,计算机视觉、智能语言识别、自然语言处理。腾讯云在这三大方向上,结合腾讯AI基础能力,再向上封装更多丰富的AI应用出来。

关于人工智能的应用,第一个应用是我们利用人脸识别的基础能力,实现了远程人脸身份证认证,内部叫人脸核身。人脸核身的解决应用,AI所做的短视频可以让伪装无所遁形。现在用AI技术非常完美的解决了身份核对这个问题,而且不需要你到营业厅和办事处,直接通过微信或者一些H5页面做人脸核身过程,只需要拍一段小的短视频。

在身份证OCR+人脸识别+活体检测三个基础技术配合使用下,形成了一个应用,这个应用能在0.01%错误接受率下,通过率超过98%。相对应的落地应用是国税、地税、公安等各种需要认证的场景。

第二个是利用基本技术天眼来做1:N的人脸检测基础。我们基于这个技术封装了一个应用,叫天眼应用。我们在地铁站、高铁站、飞机场入口甚至会议厅的入口,架一代摄像头,把摄像头和我们的系统打通,这个系统再用上天眼的应用,就能够做到精准识别进出的每一个人。

在企业级也发现有相同的用处。在企业门口架上一个摄像头,可以帮企业做安防,帮他把门禁、考勤也可以做了。只要把企业员工的库放到天眼系统里,做一个1:N的比对,每来一个人可以很快识别这个人是不是我们自己的员工,如果是,他什么时候来的也可以检测出来。有些企业有黑名单,不受欢迎的人来了,会通知保卫处。

另外,现在在AI应用里最火的,像智慧零售,也可以利用天眼的基本能力做应用。比如我们一些客户会发现他的VIP客户来了,需要做很特殊的服务,比如需要店长亲自服务。VIP来的时候,只需要在他的门店里假设若干台摄像头,VIP客户进出还有轨迹,是能够帮助门店进行优化的。

第三个应用,是基于矩阵里看到的图像识别技术能力封装出来的应用,它就叫图像多标签分类。举个例来讲,大家用苹果手机拍照之后,会看到苹果手机会自动帮你把照片归类,比如会提醒你这一类是宝宝,另外一类是风景,还有一类是地点等。其实,这里面已经融合了AI的能力,它首先要大致了解图片所拍摄的内容,再基于这个内容做一些分类。我们基于图像分类技术,封装了一个这样的应用,这个应用可以应用到所有手机厂商,帮他们相册做分类。比如OPPO,也在用我们这样的技术。这是一个案例,比如美食、婴儿、天空,都可以通过技术把它识别出来,我们支持90/300/1400的分类,而且分类支持自定义。

第四个是内容审核相关的。它包含了图像、音频、图象识别、音频识别,自然语言处理相关的技术,形成敏感图片审核,其实应该叫智能内容审核的一整套解决方案。我们可以识别出当前图片是色情还是性感,内容是色恐还是色暴,比如管制刀具、火、血还有恶意文本,这里面包含非常多合乎国家安全要求的文本规则在里面。

另外,我们也提供政治敏感人物的识别、审核。现在有更多种不同的玩法,比如还可以识别出明星。这个技术对于一类人特别好,有轻微脸盲的,他可能分辨不出这是谁,掏出手机扫一下,识别出来就是谁。这块识别的准确率非常高。

第五类是腾讯觅影,利用医疗影像识别技术,这块可以给社会带来很大的价值。我们的医疗资源相对来说比较缺乏,专家、医生、医院都缺乏。用AI技术做一些病种识别,能够把专家共享出来,让更多患者受到专家级的服务,另外识别准确率、效率远远超过一般的医师水平。比如我们现在有肺癌早筛、乳腺癌、食管癌、眼底糖网筛查。现在落地已经超过100家医院签署战略合作,比如西华医院。

第六类应用是基于车辆、物体识别技术,封装出来的视频结构化应用。这个也叫天眼,但是叫天眼动态车辆识别系统。这个可以识别出当前视频里所有车辆包括轨迹,包括是否合规,比如实现变道,变道时是否有打灯等。检测准确率超过95%,稳定支持同时超过50个识别。我们支持车标、车型等的检测。

第七类应用是文字识别OCR。它将应用非常广泛,人脸核身里面也用到了。我们典型的客户是顺丰,它用OCR技术用到运单识别,大幅度提升录单效率。

第八类应用,语音识别,基于微信的语音能力对外提供的解决方案。这也是在不同的场景里变成不同的应用,比如说在法庭里变成智慧法庭的应用。我们会和合作伙伴一起,打造一个系统,那个系统在一个庭审现场,不需要之前传统的数据源去记录法官、原告、被告等所有人的发言记录,而是通过他们面前的麦克风把现场所有的信息有条不紊的全部记录,并且结构化成最后的庭审现场文案文书。

应用了这个东西,书记员的工作量大幅降低,不需要把每个人的每句话都记录下来,另外是全程留痕。之前很难做到把每句话都记录,现在可以做到。另外,它实现了一个可能性,现在把现场所有发言情况包括辩解情况录入到一个定制化系统。如果再结合它历史的审讯大数据,可以作为一个助理审讯的后续服务。比如现在在深圳/广州的检察院、北京的知识产权法院等,在不同的法院里已经有成熟落地。

AI应用每天都在增多,因为场景是无穷无尽的,需求也是无穷无尽的。

AI技术落地场景

分享腾讯云一些AI应用落地的实际案例。

第一个,成都国税。主要使用了人脸核身应用,方便进行实名验证。

第二个,中国联通。他一样有实名的要求,所以必须做认证这个事情。但我们用这个技术给他们带来一个价值,做到日激活用户超过10万时,把人力节省到30%。这就是技术创造出来的价值。

第三个,福建公安“牵挂你”平台。这运用了第二部分提到的天眼系统,利用这套系统打通福建省公安厅所管辖的摄像头,利用这套摄像头可以帮助找走失的儿童、老人。现在大家经常看到“QQ全城助力”,也打通了天眼系统。只要有视频流接入进来,这一路视频流对应的区域都可以分析出来谁从这里走过,什么时间从这里走过,这样能够帮助做到把一些不幸的事情扳回来。比如我们上线半年帮福建省公安厅找回500多名走失人员。

第四个,是基于天眼1:1的应用实际案例。在旅游景点,之前可能买票要拿实体票再验票,现在都不需要了,买完票之后直接刷脸就可以进。这一块现在最新的进展是在云南省全省做到,云南省现在推“一部手机游云南”,也是我们的客户。我们做到买一张票,在10个、20个景点都不需要拿票,直接人脸过去就好。

第五个,在物流还有工业相关的企业里,用AI技术,用第二部分提到的AI应用和系统,帮他们解决了很多难题,帮他们降低了成本。比如像顺丰,帮他做了OCR的识别转写,结构化的事情,能帮他们节省非常大的手动录入的人力成本。

AI 创业公司走势预测

现在国内的AI创业公司非常多,包括BAT也在往AI赛道上注入很多资源,AI已经成为很多大公司的战略发展方向。我们看到的结果是很良性的,百花争鸣的状态。大公司有大公司的玩法,创业公司也有创业公司独角兽的出现。大公司和创业公司之间既有竞争,同时也有合作。

大公司的人才储备包括资金、数据储备,可能是比较全的。但即使很全,但在汪洋大海的场景里,不可能面面俱到,不可能每一个场景都做得非常深入。这里面存在非常多的机会。有些创业公司可能在某些点上做得非常聚焦和深入。

从某些角度来看,大公司后面可能会更多往平台化的方向走,可能要的是一个广度,因为需要构建自己的生态。但对于初创公司来说,第一考虑的应该是生存问题,所以要商业变现、商业闭环。可能以点破面,先在某一个点上深入进去,形成自己的核心竞争力,这样才能不断的滚雪球去壮大自己。

---END---

*本文来源善缘街0号原创,转载请联系授权

*本文仅代表作者个人观点,不代表善缘街0号立场

 

热文