这家公司每天处理9亿张图片 迅雷、酷狗、秒拍、花椒直播都是他们客户

覃羽 2016-09-07 07:54 新闻 来源:思达派 查看原文

9亿张图片是个什么概念?

相当于世界最大的社交平台Facebook世界各地的用户每天上传图片的总数的两倍。如果将9亿张图片打印成A4纸叠在一起,长度能有79.2公里,北京地铁最长的10号线总长也才57.1公里。

互联网图片、视频数据的暴涨,也给互联网公司内容监管工作带来挑战。数据显示在整个的内容里面,涉黄的比例只占万分之四以下。

但是关键是如何把这万分之四的不良内容给找出来?

以普通鉴黄师每天需审核2万张图片计算,如果没有人工智能技术的协作,这么大的工作量需要4万多人参与其中,相当于阿里巴巴员工数量的2倍多。对于任何需要进行对内容审核的互联网公司来说,都是不可承受的人力投入。

通过人工智能技术,图普科技提供一整套的图像识别服务为互联网企业保驾护航。

“其实在人工智能技术的应用上,鉴黄只是一件简单的事情。” 图普科技创始人兼CEO李明强说。

QQ图片20160906222808.jpg

人工智能深度学习方面临的三大挑战

随着行业对人工智能重视程度的提高,各种以图像识别技术为卖点的初创公司也如雨后春笋般涌现。在人脸识别、身份验证、拍照搜索、视频监控、防止疲劳驾驶等方面都有应用。图普科技将人工智能应用在了互联网的内容审核上面,正是抓住了互联网企业规避平台上色情、暴恐、时政敏感、广告等的风险的痛点。

“目前我们的识别精确度和准确率均超过99.5%,单张图片响应时间小于0.2s。”李明强说。合作互联网企业每天过9亿次的图片调用,减少了至少80%的互联网有害信息。

以迅雷为例,通过接入图普科技的图像识别云平台,由平台提供智能机器审核服务,后期数据反馈,超过98%的色情视频被机器过滤,复审量低于总量2%,节省了超过98%的人力成本。

李明强表示,让原本无意识的机器能够识别和理解图像,是人工智能的目标之一。但深度学习在研发上还面临着三大问题:

1.理论问题

深度模型都是非凸函数,在研究需要多少计算资源或计算样本才能通过训练得到更好的模型,以及理想的计算优化方法上,这方面的研究极其困难。

2.建模问题

也就是针对具体应用问题,如何设计一个最适合的深度模型来解决问题?

2.工程问题

对于互联网企业而言,如何在工程上利用大规模的并行计算平台来实现海量数据训练,是各家企业从事深度学习技术研发首要解决的问题。

克服大数据壁垒 做图像识别云平台

图像识别技术核心就在于深度学习算法,但这需要大量的经验数据去提高学习能力。

在这方面,苹果、百度、谷歌和微软等国内外的大公司有着先天的优势,另外,大公司在人才以及物资方面比较充足。往往他们也不惜投入重金,通过收购或建设以图像识别为主要课题的人工智能技术团队。

2014年4月图普科技成立后,成为国内最先做图像识别云平台的几家企业之一。较早的进入使得企业在这一领域拥有了较强的竞争优势。

1.工程技术。

图普科技不仅拥有自主研发产品的技术开发团队,通过与浙江大学合作,搭建并开放了国内首个图像识别云平台,基于大规模GPU集群搭建的人工智能超算平台,支持亿万级别的图像处理。

2.克服大数据壁垒

图普科技研发了一套关于内容审核方面的图像和视频判断的一个人工智能的模型,利用深度学习算法设计的智能程序能通过快速迭代拥有强大的学习能力。

通过与迅雷、酷狗、花椒、唱吧、今日头条、Bilibili、秒拍等知名公司合作,从而积累了大量图片和视频数据,克服了智能程序设计中关键的的大数据壁垒。

3.建立服务优势

图普科技是国内最早利用人工智能算法做审核服务的。也是在在工程经验、服务专业度方面具有先发优势。能够根据不同的客户、不同的细分领域,做单独的模型调整以及算法细节的优化,专人服务对专门的客户做专业的运营。

“图普制定的很多定价的方法、归类的方法、接口返回的定义都为后来的同行做出了一定标准和规范。”李明强介绍,在满足企业的基本需求后,图普科技逐步提供一系列增值服务,如基于图像和视频的广告投放、智能导购,直播平台的主播推荐等。除此之外,还有其他的可定制的应用场景,比如电商平台的“以图搜图”、电视台的台标识别、旅游网站的场景识别、金融行业的智能投资分析等。

人工智能技术切入移动产品创新的两个方向

李明强表示,日益普及的人工智能技术将会越来越影响到移动产品的未来创新,在产品竞争力上,人工智能可以从两个方面切入。

1.现有App可以考虑AI+

首先在体验上。

用语音识别或图像、视频搜索在海量数据中提升搜索效率,通过大数据和标准匹配来增加个性化推荐、相关推荐的智能化功能。

其次是运营上。

智能化审核文字、图片、视频等UGC内容,以此保障信息安全;描绘、分类用户画像及分析用户行为,可以为你的用户体验提供感性建议;还可以通过AI提高趣味性,比如颜值识别接口,可以为颜值打分——最近图普科技与悦跑圈合作搞了一个“鬼脸活动”,这个活动不是比美,而是比丑,看谁做出的鬼脸扮丑最厉害。

其实不仅如此,还可以利用图像识别接口做“最萌妹子”、“最文艺范”、“最性感”等有趣的评选活动,可以通过人工智能解决很多产品同质化的问题。

2.创造AI为核心的产品

比如说Google Translate,能够实时视觉翻译AI+AR,改变你看到的世界;或者是最近很火的图像编辑软件Prisma,利用AI融入艺术相机将照片变成毕加索、梵高等名画。

李明强最后建议,创业者要去思考和学习人工智能方面的知识,结合正在从事的行业或者从理解较深的行业着手,在细分领域去积累数据,新进的创业者需要去找行业的新切入点进入,这样更有机会。


为您推荐: