腾讯优图黄飞跃:视觉识别之路,被质疑的成长,短暂的迷茫

腾讯优图团队(Tencent Youtu Team)是一个从事视觉识别研究、开发和应用的团队。从2012年的一个5人小组发展到现在的一个近100人的实验室已经有4年了。 回顾过去四年,黄飞月一直被质疑,迷失在一种漫无目的和短期困惑的状态中。从人才匮乏、数据不足、品牌缺失、场景模糊到现在,他认为“生产价值”是核心。

黄飞跃博士将腾讯优图实验室定位为世界顶级人工智能实验室。在过去的4年中,他将人脸检测、人脸特征定位、人脸识别、人脸核体和图像理解技术应用于滴滴代嘉司机身份验证、警察追捕逃跑、人脸识别门禁、南宁警方电子身份等场景

基于腾讯专有项目(QQ空、伟忠银行、广电通、腾迅云)和腾讯投资项目(滴滴出行、缩微时代、京东)的服务需求,腾讯优图团队的任务包括运用人工智能技术提高腾讯产品的竞争力。

youtu团队的战略路线是:腾讯标杆项目是首选,这样可以不断优化视觉识别算法,制作沉淀技术和产品,然后通过滕循云平台向中小企业开放技术。

回顾2012年初,腾讯youtu团队只有5名成员,隶属于腾讯社交网络SNG分部。在最初阶段,它处于“无航标”阶段。该团队掌握了“图片二次压缩”技术,但还不清楚应用场景。当基于现成的技术成果发现应用场景时就是这种情况。有时,他觉得这项技术可以应用于QQ空,这可以有效减少存储和带宽流量

接下来,在2012年,在优图团队基于QQ空的图片缩略图功能中,以前的算法用于集中提取图片。在这种情况下,一个人的头像可能不包括在相框中。基于这一需求,Youtu团队开发了一种人脸识别技术,可以通过算法识别人脸。以人脸为中心的缩略图算法解决了这个需求,这就是根据需求找到解决方案的情况

从2013年到2014年,他与QQ空合作进行相册中的人脸识别。虽然取得了效果,但报告得出结论,不清楚该产品的价值在哪里。黄飞跃陷入了困惑的困境。他没有前进的方向,他周围的声音怀疑视觉识别是否有价值。

一直处于“接收和分发订单”状态的Youtu团队就像一个消防员,随时随地都可以跳到需要的地方。这些不是黄飞跃想要的。如何将现有成果转化为产品成为核心思想。

困惑过后,伟忠银行(腾讯的项目)的同事找到了黄飞跃,希望他们能制造一个工具来实现网上注册和银行开户。用户只需要使用他们的手机,扫描身份证和真人的头部,系统就可以判断他们是否是自己。基于这一功能的发展,吸引了更多类似的需求者。

后来,广电同事还要求一个工具来提取客户提交的营业执照和客户身份证,以方便信息的归档和验证,减少人工操作。 南宁公安局希望与腾讯优图联合推出“电子身份”服务。个人可以通过手机处理“电子身份”,在酒店办理登机手续,在场馆办理登机手续,在机场办理登机手续。

随着这些需求的密集爆发,黄飞岳利用这一形势,继续扩大队伍。桶理论。当需求板摆脱最后一个位置时,人才、品牌、场景、高质量数据和精确算法变成了短板。黄飞跃坦率地承认,他记得这些增长带来的压力

随着越来越多的腾讯内部项目和腾讯投资项目有着相似的需求,黄飞跃开始思考如何出口技术,为更多的中小企业提供复制服务。 因此,黄飞岳采用标杆战略,首先选择行业标杆案例(金融行业的微型银行、旅游领域的滴滴、电子商务和公安行业的京东)制定行业规划,然后通过“腾讯优图开放平台”向中小企业开放技术,当企业需求相对较大时,向滕旭云平台推荐购买服务。

与其他自主创业的视觉识别公司不同,黄飞跃博士坦率地说,他的团队没有利润指数。该公司已经给了腾讯Youtu这个使命。作为一个技术团队,核心是提高腾讯产品的竞争力。其次,人工智能处于早期阶段,可以在教育用户方面发挥作用。

此外,腾讯有充足的资金和可用资源支持。与同一轨道上的初创企业相比,腾讯Youtu团队资金雄厚,能够以第三方采购的形式获得第一批高质量的数据资源,而后续标杆项目提供了海量的用户数据,为算法的优化提供了良好的保证。然而,初创企业往往由负责人疲倦地经营,以获得第一批种子客户。

Youtu团队没有利润指数,产品应该去哪里?

黄飞跃博士认为:算法有足够的准确性是好的,技术指标和产品可用性之间应该找到平衡。

在人脸核体功能方面,准确率达到99.99%,这意味着在10,000个案例中只发现一个识别错误,而我们的实际使用场景不需要那么高的准确率。 例如,在人脸门禁识别中,准确率只需要达到99.9%(这意味着每1000人中就有一个会出错)。另一方面,准确性有时不受算法本身的影响,而是受工具的正确使用的影响,例如较差的照明效果和不正确的姿势。 因此,在面向C的产品中,方向是优化产品本身,而不是算法。

黄飞跃博士作为中国最早的视觉识别实践者之一,有着多种感官。人工智能就像互联网一样。互联网给人类带来了便利,但也带来了许多麻烦。自1995年互联网问世以来,已经有21年了。在漫长的历史长河中,21年仍然“太年轻太简单”。互联网将把人类带到哪里还不是一个恰当的例子。

同样,人工智能带人类去的地方需要更加谨慎。医生认为人工智能的核心是算法,它是一台机器。黑色产业链将不断被破解以欺骗机器。随着人工视觉识别技术的进步,人脸模拟和合成技术也将得到提高。这是一个赛马的过程。我们需要小心谨慎,过度依赖机器。与此同时,人类思考更少。

作者精心撰写的文章:

高蓉、珍阁、GGV、陈达、昆仲、祈福六位投资者解读人工智能泡沫指数

深度:无人机推动植保行业发生巨大变化

富士康昆山裁员60,000人,这是不要对未来两年制造业的“机器替代”或重大变化感到恐慌的前奏

搜狐:私营服装企业的转型之路

双11的营业额无法得到营销的支持。人工智能驱动的虚拟试衣是2017年“版权声明”的亮点。这篇文章来自1亿欧元,由1亿欧元授权发行。版权属于原作者。 请点击重印说明进行重印或内容合作。任何非法翻印都将受到起诉