每一个巨头身后,都有一个重金打造的人工智能研究院。
作者|欧拉拉
编辑|甲小姐
网址|
ID|Xtecher
上海漕河泾工业园的腾云大厦六层是腾讯优图实验室的所在地。优图隶属于腾讯社交网络事业群(SNG),是腾讯3个人工智能团队中专注于机器学习、模式识别、认知技术的研究团队,另外两个分别是AI Lab和AI团队。
“我们马上就要搬家了,不断有新人进来,办公室已经挤不下了。”优图实验室副总经理吴运声告诉Xtecher。
走进腾云大厦,穿过身份识别闸机,挂在电梯口的电视播放着雷霆战机三周年的宣传片。走进电梯,梯内挂着颜色鲜艳的冒险岛宣传材料,最下方写着负责团队的联系方式、二维码及“欢迎联系”。
优图的工作人员不好意思地笑着告诉Xtecher:“我们公司的内宣力度有点夸张,连食堂饭桌和洗手间门都不放过。”采访开始前,记者去了趟洗手间,果然。
无处不在的内宣广告
1998年成立的腾讯,是中国最大的互联网综合服务提供商之一,也是中国服务用户最多的互联网企业之一。腾讯多元化的服务包括:社交和通信服务QQ及、社交网络平台QQ空间、腾讯游戏旗下QQ游戏平台、门户网站腾讯网、腾讯新闻客户端和网络视频服务腾讯视频等。
昨日,腾讯发布的财报中显示:2016年全年,腾讯总收入为人民币1519.38亿元(219.03亿美元),比去年同期增长48%。QQ与QQ空间两个产品的使用人数分别超过8亿人和6亿人。
根基庞大、产品众多,腾讯为了促进公司内部合作、激发创造力,便在内部推行灵活开放的合作机制——为了给更多团队以展示机会,企业内宣广告更是无处不在。
在这样的环境中,优图诞生、成长,从最初遭遇质疑、陷入迷茫,到在腾讯内部合作的夹缝中逐渐崭露头角,优图在吴运声和总监黄飞跃的带领下,秉持“产生价值”的理念,一步步成长到今天,已成为一支百人战队。
这一次,Xtecher深度走进腾讯优图实验室,了解优图的创建、成长、成果以及这家巨头公司在人工智能领域究竟如何布局。
成果
优图实验室成立于2012年,从最初五人发展到如今的百余人历经四年多的时光。如今,其团队成员大都是来自北大、清华、中科院、上海交大等国内顶级院校的博士和硕士。目前,团队分为人脸、图像、语音三个主要的研究团队和配套支持的工程团队,并在这三个领域拥有数十项业内顶尖技术,且具备千亿规模的多媒体大数据计算能力。
优图团队照
吴运声给优图定下的目标是“成为国际顶级的人工智能实验室”,这个目标推动着优图在图像处理、模式识别、机器学习、数据挖掘、深度学习、音频语音分析等领域技术研发、业务落地,应用场景主要包括人脸识别、图像(如分类、鉴黄、OCR等)、音频(音乐分类、声伴分离技术、哼唱检索、音乐检索、TTS等)。
其中,人脸识别是优图最擅长的技术。
立足于腾讯社交网络大平台产生的海量人脸数据,优图进行了完整的研究和应用布局,积累了人脸检测、人脸五官定位、人脸特征提取、人脸对比、人脸推荐、活体检测等一整套技术方案,并接近世界最高水平。
该技术在腾讯内部、外部均已成功落地。内部有腾讯自有产品QQ空间、微众银行、广点通、腾讯云,腾讯投资项目微影时代、京东;外部有滴滴出行、联通、公安刑犯追逃、南宁公安、苏州公安、武汉旅游e卡通等场景。同时,优图还与腾讯云合作输出技术,推出To B业务,应用场景覆盖金融、安防、网络安全等行业,公开项目有宝宝树,世纪佳缘、百合网等。
依靠腾讯强大的产品基因,优图通过腾讯内部及外部的众多产品,将人工智能技术悄无声息地输出至数亿大众的生活之中。“研究成功落地才能产生价值”是优图一直以来的原则,也是优图同其他人工智能实验室最大区分之处。
“由内而外、自然生长式的成长。”优图实验室总监黄飞跃对Xtecher这么形容。
左起:工程技术总监吴永坚、吴运声、黄飞跃
自然生长
要了解优图,离不开这位参与缔造了这个实验室的关键人物——黄飞跃。
黄飞跃1997年考入清华大学,在计算系媒体交互与集成研究所一路读到博士,研究方向正是计算机视觉。“我硕士的课题是三维人脸建模,博士的课题是人体动作识别,其实跟现在的方向很匹配。”但2008年黄飞跃博士毕业,却找不到专业对口的工作。
十年前,正值互联网和软件开发方向学生就业的黄金年代。由于数据、硬件计算能力等限制,人工智能仍处在瓶颈期,发育缓慢。无奈之下,黄飞跃找了一份偏软件工程方向的工作。
同年,刚成立不到一年的腾讯研究院开始大规模招兵买马,“研究院嘛,给人感觉可以做研究,他们又需要博士,我就去了。”
进入腾讯研究院后,黄飞跃发现虽然挂着“研究院”的名字,但团队主要工作并不在于学术性研究,而是尝试一些新的业务拓展。当时,他带领着四、五个小组成员负责一款名叫“QQ影像”的桌面图像处理软件,有很大的技术发挥空间。但由于团队中都是技术人员,缺乏产品思维,导致产品发展不尽人意。
2010年,黄飞跃和团队迁往上海,继续在郁闷之中干了一年。他不断反思,想要找到突破口改变现状——转眼到了2011年,正逢PC向移动互联网迁移大潮,黄飞跃愈发焦虑,他知道:如果继续在原业务上止步不前,必将被淘汰。
优图团队讨论
2011年下半年,黄飞跃和团队成员发现“图片二次压缩”技术可能具有极大价值,便朝着这个方向进行更深入的研究。众所周知,腾讯内部的众多业务中包含图片储存与传输,随着研究的深入和技术的不断成熟,黄飞跃和团队开始为腾讯内部其他团队提供图片二次压缩技术——将图片压缩20%-30%,有效减少存储、降低带宽流量,为腾讯节省巨额资金及储存空间。
此时,团队更名为“优图”——这便是“优图实验室”前身。
“经过两三年挫折后,我的思想观念转变很大。我意识到如果想要做成一件事,重点只有两个——一是明确这件事的价值以及它对公司业务的价值;二是明确目标,发挥最大主观能动性想方设法把事情做成。”黄飞跃告诉Xtecher,在这个过程中,他完成了一个从没有“产品sense”的技术人员向具备全局观的团队领导者的重大转变。
“优图其实一路走来都还算蛮顺,为什么?因为任何时候我们都未雨绸缪。”
优图的图片压缩技术为腾讯创造了巨大的价值,也为优图带来了声望。但团队此时并没有松口气,他开始忧虑另一个问题:图片压缩,我们还能做多久?
2012下半年,优图把研究重心转移到人脸检测识别方向,开始进行人脸技术研发和储备。与此同时,正逢腾讯组织架构大调整,原本隶属于腾讯研究院的优图并到了腾讯社交网络事业群(SNG)旗下——这样一来,优图离实际需求更近了一步。
2013上半年,优图开始将人脸检测技术输出至QQ空间,同时将技术提供给推出爆款“武媚娘”妆容的“天天P图”前身“水印相机”团队。2013年底,QQ空间“面孔墙”灰度上线(黑与白之间,能够平滑过渡的一种发布方式),2014上半年全量推出——这是业界最早在大规模社交网络平台中人脸识别技术的运用。而此时,优图的团队依然只有20人不到。
天天P图
在QQ空间的成功落地,进一步凸显了优图人脸识别技术的价值所在,也让优图得到上层更多的重视和支持,但黄飞跃却依然没能高兴起来。他发现,虽然基于优图的人脸识别技术的确给QQ空间带来了更多用户,但说到底,此类产品都是“趣味性应用”。而优图想要的,是使技术更进一步落地、直接创造价值。
“其实说实话,对于人脸识别技术到底能创造多大的价值,那时我们也没有想得很清楚。”回顾过去,黄飞跃十分坦诚。
带着这样的想法,优图团队思考并探寻大量人脸识别应用场景。自14年上半年起,和腾讯征信负责人开始挖掘人脸识别的一个创新应用,即通过自拍照和身份证照片比对,来确认是否是用户本人(即人脸核身)。2014年下半年,团队积累的技术能力已经达到了领先水平。
这时候,中国首家民营银行和互联网银行——微众银行的项目负责人找到黄飞跃希望进行合作。与此同时的好消息是,腾讯财付通跟公安部身份证查询中心达成合作,可将身份证照片等数据提供给优图进行比对。
解决了数据源上的问题后,优图和微众银行的合作进度大大加快,双方的原型在14年底就基本完成。2015年1月,李克强总理在深圳视察时曾经考察微众银行,当时微众银行展示的,正是优图所开发的人脸核身技术。
李克强总理考察微众银行
此后,优图持续将技术开放给腾讯内部超过50个业务,并在QQ、QQ空间、QQ音乐、财付通、微众银行、天天P图等明星产品中成功落地;对外,也与滴滴、联通等标杆企业达成合作。
如今,自然生长的优图发展势头迅猛,即使背靠腾讯获得充足的资金及资源,也长期“未雨绸缪”,再加上腾讯内部灵活开放的合作机制,业务落地扎实的优图的目光也越来越具有前瞻性。
“文艺一点来说就是:仰望星空,脚踏实地。”黄飞跃告诉Xtecher。
项目
经过近几年发展,优图在人工智能多个领域均积累了领先的技术实力和解决方案,主要包括人脸技术、深度学习与图像理解、音频语音分析、智能图像处理等。
我们可以看到,基于优图的技术已经在不同应用场景中遍地开花:
对内,有腾讯自营项目和腾讯投资项目:
1.空间相册人脸识别:早在 2014 年,优图就在 QQ 空间相册中上线了人脸识别功能。用户可以标注自己或者好友照片中人脸的身份,人脸识别系统则会根据用户标注的信息,自动识别出更多的人脸身份,推荐给好友。下图是人脸识别的集中展示(空间相册 PC 版面孔墙入口)。系统对相册、浮层、猜你喜欢、feed 等场景中的人脸进行自动识别和推荐,并由 feed 扩散展示,降低用户标注门槛,让标出的面孔具有互动和社交价值。
QQ空间面孔墙
2.微众银行人脸核身:优图独创的人脸核身方案已经应用于微众银行的 App 中。凭借顶尖的人脸验证、声纹验证、语音识别、活体检测等技术,在智能手机上安全有效的解决了实名制远程用户核身验证的难题,属全球首创。目前,每天有上万人申请开户,比人工审核节省成本90%以上。现已应用于券商、银行等金融业务的全自动远程实名开户场景。
微众银行人脸核身
3.腾讯基建人脸识别门禁技术(“微影时代”):以闸机形态进行人脸识别的门禁技术。主要运用于工作人员人脸验证入场和观众人脸识别入场两种业务场景。其中工作人员人脸验证入场使用1:1人脸比对技术能迅速判断出是否为同一人,观众人脸识别入场使用1:N人脸检索迅速判断出该观众是否是购票用户。这项技术能够有效记录用户入场行为,保证演出现场安全,并能够防止黄牛囤票、出售假票的情况。在提升验票效率的同时,将验票体验也一同升级。
4.QQ音乐听音识曲:音乐识别包括原声识别和哼唱识别。原声识别是指通过话筒收集播放的音乐来检索并将正确的歌曲返回给用户;哼唱识别是指用户对着话筒哼唱一段歌曲,系统识别出用户哼唱的歌曲并返回给用户。原声识别准确率达到 99%,哼唱识别准确率 80% 以上。2015年哼唱识曲功能上线后,QQ音乐听歌识曲部分的日活用户数提升60%,App store上好评率高达90%。
QQ音乐音频识别
5.全民K歌声伴分离、MIDI制作等:全民K歌曲库中有大量歌曲没有伴奏,而市场上现有技术自动生成伴奏,可用率仅为10%,优图声伴分离技术生成伴奏的通过率达到60%以上,是市场原有水平的6倍,优图声伴分离技术为全民K歌积累了大量伴奏,占K歌总曲库的65%。
原本K歌采用人工方式制作一首MIDI需30~40分钟时间,现使用优图智能MIDI无人工制作成本,审核时间只需3分钟左右,MIDI的制作效率提高10倍以上,也使得MIDI库比原有扩充了数倍。此外,全民K歌还通过优图提供的歌词对齐技术对歌词的时序错误进行自动校验,减少了95%以上人工筛查成本。2016年下半年,用户对于歌词错误的反馈下降了24%。
对外,优图也与国内一些标杆客户直接进行深度合作,为其提供技术支持:
1.滴滴司机人脸身份验证:腾讯为滴滴出行的“滴滴代驾”“滴滴顺风车”“滴滴出租车"等业务线提供人脸识别技术。同时,引入腾讯征信大数据分析能力进行多维度的综合模型认证,通过对比滴滴司机人脸图片和司机注册照或证件照,进行司机审核验证,并定期对投诉率较高的司机进行二次验证。目前实际运行审核通过率已达到99.5%,已达到人工审核的准确标准。
2.联通大小王卡人脸激活:联通是首家采用平台通过人脸技术实现卡片激活的运营商。运用优图人脸识别技术,通过用户自拍照及后台身份证照片1:1对比进行卡片激活验证,开卡流程正常耗时只需不到1分钟。此外,优图通过对抗算法成功打击攻击用户,当前活体识别攻击样本拦截正确率99%,活体识别正常样本误打击率4-5%,并随着数据增加持续优化。
3.武汉旅游e卡通:该卡是全国范围内发行的首张全域旅游卡、首张虚拟年卡、首张刷脸入园的年卡。优图将人脸识别技术植入到景区闸机校验系统中,利用人脸识别技术实现景区刷脸入园的技术革新和创新体验。目前湖北9大城市,45家景区已全部实现刷脸入园方式。
默默走在大道上
今年两会,“人工智能”首次被写入政府工作报告,同时也引起很多代表委员们的。随着存储、计算、虚拟现实、大数据、人工智能等技术交叉融合,未来十几年后数字经济将形成全新的产业生态。
“本来我们一直在这条路上默默地走着,但2016年人工智能火了之后其实行业中掺杂了很多噪声,优秀的人才也更难招了。”黄飞跃告诉Xtecher,从他内心来讲,其实更喜欢2016年以前安静有序的市场。
从一开始解决腾讯内部需求的图片二次压缩技术出发,到一步步走到今天,优图的风格一直是自然生长、未雨绸缪。除了继续深耕最擅长的人脸识别技术之外,也在图像、语音等领域不断拓展。
此时,人才成了影响团队发展速度的一项重大因素。
有咨询机构统计,中国人工智能创业企业近五年来每年新增平均数量高达150家。此外,百度、阿里、360研究院、小米等机构也在加大力度招兵买马。
那么,优图对人才的吸引力何在?
“产品落地、技术务实,有数据、有需求。”黄飞跃告诉Xtecher,优图虽然出自研究院,但是一路走来深知创造实际价值的重要性。
优图背靠腾讯社交网络能获取到大量开放数据,结合腾讯内部团队发展需求及外部业务需求将技术落地。“总有地方可以把技术落到实处,让他看到他所做的事情在产生实际价值,是真的有用!”黄飞跃相信,对于很多技术工作者来讲,这具有极大的吸引力。
他表示,其实并不是要每个人都在腾讯里待一辈子,而是在腾讯这个系统中能够学到一项技术从技术本身到工程化到产品化的整个过程,将来即便出去也可以独当一面。
“其次,腾讯的弹性还是蛮大的。我们有足够的时间和自主权选择做一些事情和不做一些事情。”黄飞跃告诉Xtecher,腾讯对优图有很大的资金及资源上的支持,包括在花钱购买数据、成立数据标注团队方面都不留余力。
优图办公室
腾讯赋予优图实验室的核心使命是——提高腾讯系产品的竞争力。
那么,优图是否会在技术和产品的平衡以及战略布局中迷失方向呢?
“不会。”黄飞跃的回答很坚定。原因有二——其一,在腾讯待久了就会了解这是一家非常务实的公司,任何时候都必须证明自己存在的价值,不进则退;其二,不管在腾讯内部还是外部,都有团队在做相似业务,如果优图不能保持技术上领先的优势,不用说外部客户,就连内部需求也会外流。
背靠腾讯这棵大树,优图不仅资金充裕,还具有丰富优质的数据资源,为算法的调优提供了很好的保障。此外,还能借助腾讯众多业务分支以及腾讯云的平台了解市场真实需求、接触到外部标杆性客户。
黄飞跃告诉Xtecher,他反思过一个值得玩味的问题:
“如果我不在腾讯,在2012年有一个志同道合的团队一起做人脸识别,是否能做起来呢?答案是一个很大的问号。”
时代倒逼发展
事实上,互联网巨头对于人工智能技术的发展都是“倒逼式”的:由于业务分支庞大,要想提高效率,就必须使用最先进的技术,要想保住目前的地位和领地,就必须跟上技术的飞速发展。
“BAT”大佬
于是,当下BAT三巨头已进入人工智能军备赛:
百度由搜索业务起家,此后除地图之外并没有十分亮眼的成绩。2013年,百度高开高举重金投入人工智能领域,押宝无人车。并从业务、资本、组织架构等各方面全面推进向人工智能转型。如今,此前百度悉心汇聚的众多业界人才接连流失,昨日,百度人工智能研究院首席科学家吴恩达发表公开信宣布离任。但即便如此,百度依然在技术上有着深厚的储备,陆奇上任后还会有哪些大动作?众人都拭目以待;
阿里由于自身强大的电商基因,在云端构架上有着无法撼动的先天优势。如今,也成立人工智能团队ET,开始向外输出技术,并落地于城市交通及传统制造业的改造之中;
腾讯由于To C业务众多,目前有三个主力人工智能部门,优图实验室、AI Lab、AI团队。腾讯的人工智能发展基本以自身业务需求作为出发点,技术逐渐进步成熟。腾讯的基因使得研究部门在技术落地和产品化上有着先天的优势,优图成功的“自然生长”式印证了这个道理。
事实上,互联网巨头们在日新月异的互联网环境中生存并非容易之事,想要在维持现状的基础上再向前开疆拓土更是不易。
在这个过程中,为了适应和竞争,各家都已经在内部孵化出带有各自基因优势的人工智能技术,而选择在何时以怎样的方式将其目前所掌握的技术开放出去,是另一个维度上的问题——与技术本身关系不大。
吴运声告诉Xtecher,2017年,优图的计划是“走出去”,通过对外部持续的技术输出,进一步提升团队的影响力,占取更多市场份额以及获得业界口碑。
那么,优图如何走出去呢?
和腾讯云结合输出技术
腾讯“互联网+”和“腾讯云”两个团队是优图技术的对外输出的出口。“互联网+”面向政府、事业机关等单位,为其提供传统业务互联网化的能力。
2010年成立的腾讯云是优图技术的主要输出平台。基于优图所提供的技术支持,腾讯云开放了特色云技术,提供人脸识别、OCR识别、图片场景识别、音视频识别技术等全球领先的互联网技术。同时向不同垂直行业的客户(涵盖政务、电商、游戏、金融、医疗、O2O等)提供优质的行业解决方案。目前已有滴滴出行、微众银行、宝宝树、世纪佳缘、百合网等成功案例。
腾讯云合作案例
可是,当一项技术面对差异化的客户需求,从技术本身到产出最终的定制化解决方案有相当多的问题需要解决。优图和腾讯云是怎样合作呢?
腾讯云应用产品副总监王琰告诉Xtecher,在双方的合作中,腾讯云会把优图的先进技术进行云上的产品化包装和运营,最终达到商用的目的。
具体来讲,优图会提供多元化场景的AI能力,包括相关的算法、核心引擎以及配套软件。腾讯云首先将其运营在云上,为客户提供通过API按需访问的多地部署、弹性扩展、高可用高可靠的服务,同时提供开通、接入、鉴权、统计、计费等配套支持,使得客户可以自助的在云上开通并使用优图。
未来腾讯云将会提供公有云AI和私有云AI两种解决方案:公有云上,更多的是提供API化的按量付费服务,让普通小白也可以享受到最高端的行业技术;私有云上,将配合软硬件提供混合云解决方案,使对私密数据要求较高的企业、政府也可以使用腾讯优图技术。
另外,腾讯云不断将云计算客户使用优图技术的需求、优化建议进行反馈,提高优图的技术通用性以及面向行业客户的技术能力。同时,在手写OCR等行业难点上,客户只要提供部分数据源,腾讯云和优图就可以在很短的时间内攻克问题。
王琰表示,优图实验室是对腾讯云智能化战略的强有力支持,优图多年来的技术储备迎来如今的商业爆发浪潮。她相信以两个团队的合力,必定能够使腾讯AI的商业化走向成功。
马化腾在2016年的“互联网+峰会”上表示:云服务、地理位置信息LBS、安全及支付将是腾讯未来的四件大事。他此前在央视财经《对话》访谈中有一句经典回答也被业内反复引用——未来主体是传统行业利用互联网技术,在云端用人工智能的方式处理大数据。
在未来,云计算是基础设施,也是根基。腾讯云将会成为腾讯对外输出科技实力的核心窗口,也是未来争夺市场的战略高地。而优图实验室则是腾讯云背后提供技术供应的强大后盾,战略意义重大。
马化腾的焦虑,与优图的信心
刚刚过去的两会无疑为已经烧得很旺的人工智能再添一把火。
接着,3月16日“2017中国IT市场年会”在北京召开,随着《“互联网+”人工智能三年行动实施方案》的发布和国家对制造业的高度重视,2016年中国人工智能市场规模快速增长,全年超过230亿元。预计2018年将达到381亿元,复合增长率达26.3%。而根据 IDC 发布报告预测,到2020年全球人工智能和认知系统的采用为企业带来的收入将超过 470 亿美元。
面对如此庞大的市场和明确的趋势,谁不是野心勃勃呢?可重点是,如何布局才能在这一波浪潮中乘风破浪抵达彼岸。
2017年3月3日晚,马化腾在北京新世界酒店向大家介绍了此次两会的七个提议后,接受了近两个小时的记者问答。马化腾说:谈到人工智能,我是焦虑的。
马化腾表示,“可能过去有很多红利(人口红利、流量红利、内容红利),但是最终还是要看到技术才是不可逾越的东西。我们现在越来越感觉到,归根结底还是要通过技术的进步,企业才有可能有保持在战略方面的制高点。”
在去年11月的乌镇互联网大会上,马化腾在提到人工智能时曾表示:人工智能虽然经过几十年的积累,但是在过去一年得到了一些的技术突破,想要把这些技术落实到具体的应用上不是那么简单的。
通过这两次发言,马化腾焦虑的重点其实很清晰:技术、技术落地。
对此,优图团队信心满满:“虽然前方还有很多挑战,但在AI技术落地方面我们善于发掘机会、工程化能力强、有产品sense,这一整套流程正是优图最擅长的!”
不知道,这是否能够缓解马老板心中的焦虑呢?
我是Xtecher高级记者欧拉拉,如果您有国内外科技行业新鲜资讯或独到见解,欢迎与我联系。
:Oulalala
邮箱:ruoyun.ou@xtecher.com
(添加好友请注明公司、职位、事由)
━━━━━
封面设计:王思宁 排版:陈光 校对:欧拉拉
━━━━━
Xtecher官网平台现开通认证作者,
有发稿意向的个人或媒体,可联系:jueshao121
(添加好友请注明公司、职位、事由)