苹果3D视觉报告:龙头引领行业大趋势 (上篇)

2017-09-13 09:59 人工智能 来源:创头条 查看原文

编者按:本文来自微信公众号“海通电子研究”(ID:htzqdz),作者 海通证券电子团队。

3D视觉作为一项激动人心的新技术,已经出现在微软Kinect、英特尔RealSense等消费级产品中。近几年,随着硬件端技术的不断进步,算法与软件层面的不断优化,3D深度视觉的精度和实用性得到大幅提升,使得“3D深度相机+手势/人脸识别”具备了大规模进入移动智能终端的基础。作为全球手机当之无愧的龙头,我们认为苹果率先大规模采用3D视觉技术,将彻底激活3D视觉市场,开启全新时代。


我们通过本报告,详细地梳理了苹果3D视觉结构光的技术方案与硬件结构,分析了细分零部件的价值和技术壁垒,详细梳理了整个苹果3D视觉产业链公司和国内潜在受益公司。我们相信3D深度视觉进入消费级智能终端将是大势所趋,这将为TX发射端(VCSEL、DOE、WLO)、RX接收端(红外CMOS、红外窄带滤色片、光学镜头)、图像处理芯片、系统模组组装四大环节带来全新的市场价值。移动端3D视觉在AI和AR方面带来颠覆性、全新的用户体验,预计将实现快速的渗透与普及,消费电子从此进入“AI+AR”新时代。

移动端3D视觉结构光方案对于国内公司而言,最核心的受益标的包括:滤色片——水晶光电(002273.SZ)、WLO——华天科技(002185.SZ)、模组制造——欧菲光(002456.SZ)、光学镜头——联创电子(002036.SZ),建议关注:模组制造——舜宇光学科技(02382.HK)、VCSEL——光迅科技(002281.SZ)、VCSEL代工——三安光电(600703.SH)。

投资要点:

龙头全新意志,开启消费电子“AI+AR”新时代。3D视觉作为一项激动人心的新技术,在苹果等巨头的推动下,具备了大规模进入移动终端的基础。我们认为苹果即将大规模采用3D视觉技术,将彻底激活3D视觉市场。我们通过本报告,详细地分析了苹果3D视觉结构光的技术方案与硬件结构,分析了细分零部件的价值和技术壁垒,梳理了整个苹果3D视觉核心产业链和国内潜在受益公司。我们相信3D深度视觉进入消费级智能终端将是大势所趋,移动端3D视觉将实现快速的渗透与普及,消费电子将从此进入“AI+AR”新时代。

全球科技领袖苹果积极布局3D视觉,引领行业大趋势。在收购了Primesense之后的四年时间里,苹果对3D视觉技术已经进行了充分的研究和储备,移动端3D视觉结构光技术已经进入成熟期。自2016年底以来,关于苹果即将在iPhone8采用3D视觉的信息不断得到确认。综合欧美台产业链、供应商等方面的信息,我们判断苹果十周年旗舰机iPhone 8采用正面3D视觉基本可以确定,苹果率先大规模采用3D视觉技术,将引领行业大趋势。

借3D视觉,苹果引导消费电子进入“AI+AR”新时代。3D视觉结构光方案用于人脸识别可替代指纹识别,助力iPhone 8实现酷炫全面屏;3D人脸识别打开了更加广阔的人工智能应用空间,助力苹果走向AI大平台;借助3D视觉技术实现的三维手势识别,能够实现动态快速的手势识别与追踪;iOS设备添加3D视觉之后,将在AR体验方面全面升级,3D视觉所提供的景深信息和建模能力是现有普通摄像头无法比拟的,我们认为苹果的AR体验将更加出色。

移动端3D视觉市场空间巨大,有望加速渗透。3D视觉技术目前已经在工业和医疗领域取得成功,也有在消费级市场进行尝试,但由于缺乏较佳的应用场景,技术还不够成熟,导致市场并未激活。我们认为在苹果的带动下,3D视觉将打开消费级市场,行业进入加速趋势。特别是人脸识别、体感交互将成为3D视觉获得突破的关键,同时AR也是极有潜力的应用领域。经过我们的计算,2020年全球智能手机端3D视觉硬件市场规模将到达99.25亿美元,其中前置结构光市场规模为66.78亿美元,后置TOF时间光市场规模为32.47亿美元。

3D视觉结构光方案深度拆解与供应链分析。通过拆解和分析结构光先驱Primesense的产品结构,可以看到整个结构光产品方案主要由四部分组成:TX发射部分(VCSEL是近红外光源最佳方案,DOE对于结构光方案至关重要,晶圆级光学元件WLO是核心组件)、RX接收部分(红外CMOS传感器需要特制,近红外窄带干涉滤色片价值提升,红外摄像头用光学镜头要求不高)、可见光摄像头(非新增业务)、专用数据处理芯片(技术壁垒高)。此外,3D视觉系统模组制造与组装由于难度大、价值高,也是重要的增量市场。

行业“增持”评级,关注优势企业。苹果3D视觉供应链核心公司:VCSEL(Lumentum+稳懋)、DOE(台积电+精材)、WLO(Heptagon)、红外CIS(意法半导体+台积电)、窄带滤色片(VIAVI)、光学镜头(大立光)。移动端3D视觉结构光方案对于国内公司而言,最核心的受益标的包括:滤色片——水晶光电(002273.SZ)、WLO——华天科技(002185.SZ)、模组制造——欧菲光(002456.SZ)、光学镜头——联创电子(002036.SZ),建议关注:模组制造——舜宇光学科技(02382.HK)、VCSEL——光迅科技(002281.SZ)、VCSEL代工——三安光电(600703.SH)。

风险提示:3D视觉技术移动端进程过慢;国内相关公司缺乏竞争力。

全球科技领袖苹果积极布局3D视觉,引领行业大趋势

苹果布局3D视觉多年,进入技术成熟期

国际科技巨头纷纷布局3D视觉。2012年以来,3D视觉开始受到全球各大科技巨头的重视,包括苹果、微软、英特尔、谷歌、索尼、三星等公司纷纷加码3D视觉,如2012年左右,微软收购了3D-TOF相机公司canesta和3dv;2013年,英特尔推出RealSense实感技术,谷歌推出Project Tango项目,苹果收购结构光先驱PrimeSense;2015年索尼收购了3D视觉综合技术供应商SoftKinetic,Facebook旗下Oculus收购3D手势识别公司Pebbles。

作为全球消费电子的王者,苹果公司投入最为积极,早在2010年左右便开始在3D视觉方面展开布局。2010年9月苹果收购了瑞典三维图像识别公司Polar Rose;2013年11月以3.6亿美元收购了3D视觉结构光方案先驱PrimeSense,获得大量专利和技术;在2015年之后,在3D视觉、人脸识别、图像识别等方面,苹果先后收购了Linx、Faceshift、Emotient、Flyby Media、RealFace等多家公司,形成了全面的产业布局。

通过收购结构光先驱PrimeSense,苹果掌握了3D视觉最核心的技术。以色列科技公司PrimeSense是全球知名3D视觉方案供应商,于2006年研发出结构光3D传感器,是3D视觉结构光方案的先驱,随后成功应用至微软Kinect1代(2010年)、华硕Xtion(2011年)等产品中。

通过对Linx、Faceshift、Emotient、Flyby Media、RealFace等多家公司的收购,苹果已经为3D视觉领域搭建了完善的生态体系。例如LinX的多摄像头技术、Faceshift的面部表情识别技术、RealFace的人脸识别技术等。

自2013年收购PrimeSense之后,苹果推动PrimeSense的3D体感传感器向小型化方向发展,在3D视觉方面加大投入,不断推出技术升级和专利布局,希望未来可以将其装配到TV、PC上,最终可以用在苹果核心的iPhone/iPAD系列产品上。

例如,2015年4月,美国专利局公布苹果3D手势控制技术专利,是一种能够精确识别人手手势的3D机器视觉系统。利用这种技术可以通过专业化的算法精确地识别用户的手势。2015年10月,苹果公司关于手势和面部识别的专利再次出现,当用户与他人通过视频相关的应用(如视频)进行互动时,他们可以通过简单的手势,将视频画面中特定对象保存为本地图片,这需要3D视觉技术才可以完成。

2016年7月,苹果公布新型3D手势控制专利,是一个3D图像投影仪,内嵌在一个诸如iPhone手机这样的iOS设备上,可以识别出用户的手势操作,由此可以作为把手势作为游戏的控制杆或者控制器。

2015年7月,美国专利局批准了一项苹果提交的面部识别专利,名为“低门槛面部识别”,基于前置摄像头捕获的图像,然后图像处理器对该图像进行处理,随后便与存储在参考模块中的图像进行对比。

2017年3月苹果发布3D视觉新专利——利用景深信息进行人脸识别,该专利有望用于下一代iPhone的3D相机系统,该专利的部分技术出自PrimeSense公司。

可以说苹果公司在3D视觉各个方面都进行了深度的布局,一方面收购行业内优秀的公司,进行技术布局和生态建设,另一方面不断优化技术,发布专利,进行专利布局。苹果的目标就是引领3D视觉发展趋势,从而牢牢占据技术制高点。可以说,在2013年收购Primesense之后的四年时间里,苹果对3D视觉技术已经进行了充分的研究和储备,我们认为苹果移动端3D视觉技术已经进入成熟期,具备大规模应用的技术基础。

十年里程碑iPhone 8备受期待,创新性3D视觉已成定局

在众多智能手机厂商中,苹果公司独领风骚。它在2007年推出的第一代iphone成为了一个时代的里程碑,尤其是大尺寸触控LCD液晶显示屏,相比于功能手机时代的显示屏,具有巨大的消费吸引力,一举奠定了智能手机在消费者心中的优势地位。

在光学摄像头方面,苹果始终保持行业领先地位。从最初2007年的第一代iPhone到2016年的iPhone 7/7Plus,苹果手机在不断提升相机像素的同时,逐渐加入HDR、Slow-Mo、Focus Pixels、Live Photo等功能,特别是在摄像的娱乐性方面,逐渐支持面部检测、全景拍摄、慢动作视频、动态照片记录等功能,这些新技术的不断采用,引领了消费电子摄像的发展趋势。在硬件发明,苹果自研的ISP图像处理芯片,可以对图像进行十分先进的白平衡处理、色彩处理、图像/视频数据解码等,使得苹果手机具有行业顶级的拍照/摄像性能。

苹果即将于2017三季度发布的iPhone 8将采用3D视觉相机。作为苹果iPhone十年的重要产品,新一代iPhone 8被苹果公司寄予厚望,特别是在3D视觉相机方面,基本已经确定将引领行业趋势,开创3D视觉消费电子大规模应用的先河。

最早是在2016年11月,韩国供应链(如韩国经济日报等)称苹果将和LG联手打造可以3D拍照的摄像头原型,会应用在iPhone8上;2017年2月,来自台湾供应链(如科技时报、Digitimes等)称,iPhone 8将配备“革命性”前置摄像头,包含红外模块,可以感知摄像头前的3D空间与物体;2017年3月,苹果CEO蒂姆•库克在接受《独立报》采访时表示:“苹果十分重视AR技术,而3D相机将成为AR技术的第一步,能够让互联网与现实世界相结合。”;2017年5月,美国权威科技媒体Business Insider报道,苹果有超过1000名工程师正在从事3D相机的研发工作,iPhone 8即将搭载的3D相机将用于人脸识别而不是虹膜识别。


欧美和台湾多家核心供应商确认,将为某大公司大规模提供3D视觉相关零部件,我们认为该公司基本可以确认为苹果公司。2017年第二季度,电子行业多家核心供应商均表示,已经接到3D视觉相关零部件的订单或达成协议。

2017年3月,意法半导体在Q1财报会议上表示,17年资本支出会出现一次性的大幅增长,主要是为大客户定制红外CMOS光学传感器和3D视觉系统;2017年6月,苹果相机镜头核心供应商大立光称,将在17下半年大量出货3D相机用光学镜头;2017年6月,美国《巴伦周刊》报道,VIAVI已经与苹果签署订单意向协议,苹果将向VIAVI采购1.5亿颗光学滤光片用于iPhone系列的3D视觉相机;2017年8月10日,VCSEL核心供应商Lumentum在FQ4财报会议上透露,18年将会有1.6亿台iPhone附带3D相机功能,Lumentum将会是VCSEL激光器的主力供应商。

综合产业链、供应商的信息,我们判断苹果十周年旗舰机iPhone 8采用正面3D视觉基本可以确定,作为全球手机当之无愧的龙头,我们认为苹果率先大规模采用3D视觉技术,将彻底激活3D视觉市场,开启全新时代。

苹果3D视觉方案将从前置结构光开始,未来逐渐引入后置TOF

根据原理和硬件实现方式的不同,行业内所采用的3D机器视觉主要有三种:结构光、TOF时间光、双目立体成像,其中,结构光与TOF方案在技术方面较为成熟。

结构光方案已经被成功应用于游戏体感交互、工业机器视觉检测等领域,在消费级产品方面PrimeSense(已被苹果收购)公司技术储备深厚,方案成熟;TOF时间光方案被广泛应用于医疗检测、机器人视觉等领域,在消费电子方面,受到谷歌、意法半导体、德州仪器、英飞凌等公司的支持;双目立体成像技术刚刚起步,目前主要在自动驾驶等领域受到关注。

3D视觉三种方案各有优缺点:双目立体成像方案软件算法复杂,技术还不成熟;结构光方案技术成熟,功耗低,平面信息分辨率高,但是容易受光照影响,识别距离近;TOF方案抗干扰性好,识别距离远,但是平面分辨率低,功耗较大。

综合来看,结构光方案更加适合消费电子产品前置近距离摄像,可应用于人脸识别、手势识别等方面,TOF方案更加适合消费电子产品后置远距离摄像,可应用于AR、体感交互等方面。

我们判断,2017年苹果3D视觉将从结构光方案开始,未来逐渐加入TOF方案。2013年苹果收购结构光先驱Primesene之后,不断提升其结构光方案的技术成熟度,先后发布多项专利,为结构光方案的成熟商用做了大量准备。根据我们前文的分析,结构光方案目前技术成熟,分辨率高,适合近距离3D视觉场景,有望应用于苹果新一代iPhone 8前置方面。

特别是来自台湾供应链(根据Digitimes等)的信息确认,精材和采钰将分别为苹果2017款手机提供DOE(衍射光栅)的封装和ITO材料,而DOE器件仅被结构光方案所必须,因此,我们判断苹果新一代iPhone 8所采用的3D视觉将从结构光方案开始。苹果公司在AR方面野心勃勃,计划将AR打造成未来的重要应用领域,而TOF方案更加适合远距离AR应用,因此,我们认为未来苹果将通过加入TOF方案实现先进的AR体验。

借3D视觉,苹果引导消费电子进入“AI+AR”新时代

3D视觉+生物识别,助力iPhone 8实现酷炫全面屏

自2016年底开始,手机显示屏的竞争在三星、小米、LG等厂商的推动之下,已经向18:9甚至18.5:9、19:9、20:9的长宽比挺近。特别是小米MIX和三星S8的推出,使得高屏占比“全面屏”已经成为高端手机的最新潮流。

作为全球智能手机的领头羊,苹果公司自然不甘人后,最新款iPhone 8大概率将配备高屏占比显示屏。2016年底到2017年初,根据台湾供应链(科技时报等)的信息,苹果计划在2017年第3季推出的首款AMOLED手机iPhone8,将采用5.8寸18.5:9的长宽比例亮相,显示面积高达 5.15寸,屏占比高达85%,取消实体Home键。

但是,移除正面Home键意味着苹果旗帜性的指纹识别需要大变化。目前手机端指纹识别的主流方案为电容式方案,其信号难以穿透0.3mm以上的玻璃,因此现有的电容式方案难以实现屏幕下指纹识别。为了实现全面屏,同时又保留指纹识别,三星便不得不将正面的指纹识别移至背面,这是一种妥协的方案,用户体验是一种倒退。

备受关注的光学式与超声波式指纹方案由于技术不成熟,未通过苹果测试。与电容式指纹识别相竞争的另外两种方案——光学与超声波,展现出具备全屏幕指纹识别的潜力,但是无论是新思科技重点研发的光学式方案,还是高通力推的超声波方案,都在技术上难以达到苹果的稳定性和成熟性要求,这两种方案还有待技术的进一步成熟。

我们认为,3D视觉结构光方案用于人脸识别可替代指纹识别。苹果在结构光3D视觉方面积累的技术,给了其放弃指纹识别的信心。采用结构光原理的人脸识别属于高级的三维人脸识别技术,相比于传统的二维人脸识别,在识别精度和速度方面大幅提升,特别是与指纹识别相比,3D人脸识别用户体验更佳,操作更加便捷,因而备受期待。

3D视觉+人工智能,助力苹果走向AI大平台

3D人脸识别不仅仅在识别精度方面大幅提升,更重要的是打开了更加广阔的人工智能应用空间。例如利用三维人脸识别可以直接获取消费者面部表情(喜怒哀乐等),通过人工智能技术,可计算出用户的生理年龄或精神状态,这些功能都将为消费电子带来全新的玩法;人脸识别还可以用于移动端自拍的快速对焦,用户自拍美颜等功能。

2017年6月WWDC会议上苹果发布了新的机器学习API——Core ML,支持人脸追踪、人脸检测、自然语言处理、文本检测等任务。Core ML的核心是加速在iPhone、iPad、Apple Watch上的人工智能任务,支持深度神经网络、循环神经网络、卷积神经网络、支持向量机、树集成、线性模型等。

可见苹果在AI人工智能方面具有打造大平台的野心,通过Core ML为广大开发者提供AI机器学习和建模能力,从而使众多iOS终端产品具有AI功能。3D视觉将成为该战略中核心的一环,通过3D视觉硬件可以提供精确的人脸识别、动作捕捉等功能,与Core ML平台形成生态与数据协同。

3D视觉+体感交互,开启人机交互新体验

现如今,大尺寸触控显示屏已经是大多数智能终端的标配,无论是智能手机、平板电脑,还是笔记本电脑,甚至于汽车中控台、智能家电等。尽管触控显示屏的识别精度和清晰度越来越高,但是,触控显示屏的局限性非常明显:手指必须接触于屏幕表面,无法离开屏幕工作,这极大地限制了用户的使用空间和灵活性,为了解决这一问题,语音控制与体感控制开始出现,并被广泛看好。

语音识别可以完全解放双手,但是在人机互动方面的应用场景有一定的局限性,对于游戏娱乐、互动体验、拍照等领域,这些必须有用户肢体参与的场景,语音交互无法满足需求。因此,比现今触控屏更高层次的体感交互成为了广大厂商追求的目标。

要实现体感交互,最重要的就是手势识别,因为手部动作是人体最丰富也是最常用的体感动作。对于智能手机而言,如果手势识别可以得到应用,那么包括手机自拍、游戏、浏览网页、购物等众多应用场景,在用户体验上均可以实现大幅提升,手机也将从触控屏时代走向手势识别时代。

3D视觉的出现为手势识别与体感交互打开了新空间。传统手势识别主要为二维识别技术,可以判断手部的静态信息,但是不能识别持续变化、动态的手势,因而用户体验不佳。借助3D视觉技术实现的三维手势识别,能够实现动态快速的手势识别与追踪,这为人机交互打开了新的空间。

例如,手机拍照是目前非常主流的消费级应用,但是目前拍照基本都需要手指按压控制键(或触控屏幕)完成,而采用外置的蓝牙控制器因为不够方便,应用的并不多。所以,对于用户而言,是无法通过自身完成远景自拍的,需要别人的帮助。如果,手机配有手势识别功能的话,用户自己就可以实现远景自拍功能,目前已有公司正在开发基于3D视觉的自拍功能。

3D视觉将开启移动终端人机交互新方向。将3D视觉技术与移动终端结合,将开启众多新玩法,如用户通过手部动作直接与游戏进行互动,这将大大提升移动终端的娱乐体验。苹果公司在手势识别方面已经研发多年,在利用3D视觉技术进行手势识别与体感交互方面,已经储备多项专利技术。

3D视觉+VR/AR,苹果打开“虚拟/增强”新世界

3D视觉在VR/AR领域应用空间大,人机交互体验佳。从2015年以来,VR/AR逐渐走入大众视野,尤其是Oculus、HTC VIVE和索尼PSVR三大VR头显在2016年的先后发布,激活了VR市场。同时,微软在2016年也推出了第一款商用消费级AR设备HoloLense。VR/AR产品在用户体验和应用场景方面带来了颠覆性的改变,人机交互作为其核心的功能成为广大厂商关注的焦点,尤其是手势识别实用性最佳。

例如,2016年Inuitive和gestigon两家公司携手合作,将手势识别功能嵌入VR设备中,其中,Inuitive公司提供NU3000多核心3D影像处理器和深度摄像机,gestigon公司提供手势识别算法;微软AR头显HoloLense,集成了4颗环境摄像头、1颗景深摄像头(基于3D-TOF原理)、1颗高清摄像头、1个IMU(惯性测量单元)、1个环境光传感器,可以提供较为优质的3D手势识别功能。

3D视觉在AR领域应用潜力巨大,提供强大建模能力。对于AR而言,其核心功能是在现实物体上叠加虚拟信息,将真实世界和虚拟世界“无缝”集成,从而为用户提供真实与虚拟叠加的全新体验。因此,在AR众多相关技术中,3D建模是至关重要的,需要借助3D视觉景深相机在现实物体的基础之上构建虚拟的图像画面。

在该方面,谷歌公司表现积极,其力推的Project Tango项目包含高级的深度感知能力。Project Tango可以提供结构光(1代)和TOF(2代)两种技术方案,在结构光方面是与PrimeSense合作,随着Primesense被苹果收购,不再对外输出技术,谷歌在2代Tango开始采用TOF技术,Tango的深度传感器采集三维信息输出“点云”数据,结合运动追踪的轨迹数据达到了对“点云”的实时拼接,从而实现精确的3D建模。

苹果计划未来重点打造先进AR体验,我们认为3D视觉将提供重要支持。2017年6月WWDC会议上,苹果发布ARKit开发平台,能够利用每一部iPhone和iPad上的摄像头,以及各种传感器,创造出出色的AR体验。凭借苹果庞大的iOS用户群和开发者群体,ARKit一举成为全球最大的AR开发平台。但是,目前该平台主要基于传统摄像头,在AR体验方面与3D摄像头相比有较大差距。

根据独立报的报道,苹果CEO蒂姆库克强调,AR将是苹果未来不可或缺的重要环节,有了AR,苹果的iPhone手机将更加具有吸引力。库克表示在2017年秋季推出iOS 11后,能看到各种各样的AR应用,目前开发人员正在开发大量基于ARKit的应用和游戏,它们也将于2017年秋季开始推出。

尽管目前ARKit主要利用iPhone、iPad等设备现有的摄像头实现AR体验,但是如果iOS设备添加3D视觉之后,将在AR体验方面全面升级,3D视觉所提供的景深信息和建模能力是现有普通摄像头无法比拟的,借助3D视觉苹果的AR体验将更加出色。

风险提示:3D视觉技术移动端进程过慢;国内相关公司缺乏竞争力。

为您推荐: