2014年第1期46中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis谷歌眼镜采用的重要专利技术介绍□ 张德珍 杨凯鹏 崔 皓摘要:本文对谷歌公司针对谷歌眼镜的重要专利申请进行了介绍,涉及谷歌眼镜的成像技术、物体捕获技术、人机交互技术、其他结构和功能以及应用。关键词:谷歌公司 谷歌眼镜 专利申请 成像 物体捕获 人机交互 应用随着信息技术的发展,继智能终端后,可穿戴设备成为业界关注的热点。2012年4月,谷歌(Google)公司推出的谷歌眼镜(Google Glass)引发了无数科技爱好者的追逐,在可穿戴设备领域引起强烈反响。在推出产品的同时,谷歌公司也针对该新产品进行了全方位的专利布局。本文以EPOQUE系统的TXTUS0库~TXTUS5库,以及WPI库中公开的与谷歌眼镜相关的专利文献为基础,采用申请人谷歌公司结合关键词的方式进行检索,检索截止日为2013年6月18日。由于发明专利申请一般在申请日之后18个月公开,因此,部分相关专利申请可能处于未被公开状态而没有被统计。通过人工阅读检索到的文献,对文献进行详细标引,笔者将谷歌眼镜所涉及的专利申请分为5个方面,包括成像技术、物体捕获技术、人机交互技术、其他结构和功能、应用。下面将结合专利申请来进一步分析各技术分支。一、成像技术在谷歌公司关于谷歌眼镜的专利申请中,涉及成像技术的专利申请共16件,其中大部分涉及谷歌眼镜的硬件结构,即如何使虚拟图像呈现于用户眼前,也有部分是为了提高用户的感知度,进一步在细节方面作的提升,比如虚拟图像亮度的调节、虚拟图像位置的设置等。在成像技术中,如何将虚拟图像显示于人眼前是最核心的。追踪谷歌公司的专利转让信息可发现,在其计划推出谷歌眼镜时,其于2011年收购了富士通公司的专利US2001010598A1,该专利是2001年1月30日申请的,揭示了智能眼镜的基本原理和架构,是一件非常重要的基础性专利。通过对该专利的收购,谷歌公司弥补了其在谷歌眼镜专利布局上的缺失,将专利布局的时效向前推了10年,为将谷歌眼镜推向市场提供了专利支撑和有效的防御。在谷歌公司自己申请的专利中,基于光线反射方式成像为目前这一代谷歌眼镜的成像方式。专利申请US8189263B1提供了一种图像波导,如图1A所示,包括将输入光接收到图像波导的耦合区域205,和将图像波导发射出去的出耦合区域210,耦合区域205和出耦合区域210分别具有图1B所示的表面220和225,通过具有该结构的波导将来自计算机生成图像(CGI)的光线最终反射到人眼中,而真实世界的光线也可以穿过225区域进入人眼,从而实现增强现实这一技术。在该专利技术中,光线在波导中的传输方式为经过多次全反射,然后进入人眼,这种方式可能会导致一部分光线从反射面折射出去,造成光线损失,降低成像质量。专利申请US20130016292A1基本展示了谷歌眼镜产品的成像原理。如图2所示,该专利申请提出的眼镜包括照明模块210、光传输管道215、可视区域220、偏振旋转器225和端反射器230,其中照明模图1 图像波导成像技术(专利申请US8189263B1)AB
2014年第1期47中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis块210包括灯235、聚光透镜240、偏振光分光器PBS 245、LCOS面板250,可视区域220包括PBS 255和非偏振光分光器BS 260。其中灯235可选用发光二极管,通过PBS 245的反射照亮LCOS面板250,照明模块210生成的计算机生成图像(CGI)光线无需全反射,沿着传输路径265传输直接到达端反射器230,在可视区域220的PBS 255被配置为使与通过PBS 245的线性偏振光相同的线性偏振光通过,反射其他线性偏振光,而两个线性偏振光都可通过BS 260,但是只通过每种的一部分线性偏振光,对两种线性偏振光都反射。这种双反射元件可以扩展眼球视线范围205。在该结构中,光传输管道215为透明材质,现实环境光线可以穿过它并进入人眼,从而使得虚拟图像与现实环境重叠显示,实现增强现实技术。此外,该专利申请的光线传输方式相对于通过全反射方式传输光线,可减少光损失、克服重影。图2 图像成像技术(专利申请US20130016292A1)专利申请US20130021658A1从另一个角度对谷歌眼镜这一产品的成像结构进行保护。该专利申请提出了一种光学系统,如图3所示,包括显示面板118、图像生成器116、可视窗口112、近端分光器110、远端分光器122,远端分光器122光耦合于显示面板118和近端分光器110。显示面板118生成光带,图像生成器116用于从显示面板118生成的光带生成虚拟图像,近端分光器表面114反射虚拟图像的光线,并且允许外界光线通过,即通过近端分光器,外界的光线和虚拟图像沿着可视轴方向人眼均可看见。图3 光学系统(专利申请US20130021658A1)在具备了基本的成像结构之后,为了提高用户的体验度,谷歌眼镜基于该基本结构针对图像的显示效果应用了多种有效的技术手段。第一,提高虚拟图像显示的清晰度。由于外界环境的光强不同会影响虚拟图像的显示效果,专利申请US20130063486A1提出了头戴式显示设备(HMD)的虚拟图像与真实世界对比度控制方法以及相应的硬件设备。如图4所示,远端58设置有光学传感器94,如CCD图像传感器、CMOS传感器,用于捕获外界的光线以及图像或视频,从可视区可同时看到虚拟图像和真实世界,从接收的外界的光获取真实世界的图像,识别出虚拟图像重叠的真实世界的图像中的背景特性,获取可视特性,与上下阈值进行比较,从而控制生成虚拟图像的光带。通过该方法,可以使得用户清楚看到虚拟图像,同时也可以看清楚真实世界。图4 光学系统(专利申请US20130063486A1)专利申请US20130113973A1则提供了另一种自适应控制眼镜亮度的方法,如图5所示。首先,捕获周围环境的图像数据,基于图像数据计算亮度值,根据
2014年第1期48中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis图7 光学系统(专利申请US20130070338A1)图5 头戴式显示设备自适应亮度控制(专利申请US20130113973A1)图6 光波导装置(专利申请US20130108229A1)图8 具有非平行表面图像波导的HMD(专利申请US8294994B1)亮度值确定偏压电源的设置,偏压电源设置应用于生成计算机生成图像(CGI)的照明源,并且基于偏压电源设置控制显示在用户眼前的CGI亮度等级。专利申请US20130108229A1提供了一种波导结构。如图6所示,该结构具有分离设置的前后平面,显示输入区域设置在近端,设置于波导内或上的可切换镜面层218可控制照射到输出区域的环境光数量。第二,降低眼镜的重量。专利申请US20130070338A1与US20130063486A1中的HMD具有类似的结构,在专利申请US20130070338A1中特别提出了区域205为空气腔,使得HMD更轻便,如图7所示。第三,显示器结构的个性化。专利申请US8294994B1提供了一种具有非平行表面的图像波导,波导的形状可以为任意形状。图8为配置了该具有非平行表面的图像波导的HMD,其中光源位于两个显示器的中间,通过分光器将光分向左右两个显示器。第四,提高虚拟图像显示效果。专利申请US20130088413A1提供了一种光学系统,如图9所示,包括光学路径调节器,用于调整显示面板和图像生成器之间的光学路径长度,以调整虚拟图像与用户的距离,将相关的虚拟图像显示于用户所关注的现实世界目标物体附近。其中可以通过自动对焦照相机产生自动对焦信号,由计算机基于自动对焦信号控制显示面板和光学路径调节器。
2014年第1期49中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis谷歌公司在谷歌眼镜的图像成像技术中,还提出了其他方式:专利申请US20130016413A1提供了一种全图像扫描镜显示系统,如图10所示,包括图像源205、反射图像源的图像的扫描镜、调整扫描镜的驱动器、扫描控制器,用于控制扫描镜的位置,使得眼部区域显示的图像比图像源图像大。同时该系统还包括眼动跟踪系统,实时跟踪捕获眼部图像,分析人眼凝视方向,反馈至扫描控制器,以动态调整驱动器的位置。此外,本专利申请提出在扫描镜中增加衍射光栅,更利于图像显示。专利申请WO2013062654A1提供的HMD成像方式为光衍射方式。如图11所示,该HMD包括一个具备导光特性的光线承载物,其由透明显示区域和一个由不同衍射元素构成的重复构型组成,这个重复构型分布排列在导光承载物的透明显示区域上,组成了一个衍射光栅,能够把弹跳在这个光栅上的CGI光线弯曲和集中。采用此方法,衍射光栅并不生成全息影像,而是将照在它表面的图像呈现出来。图9 具有光学路径调节器的光学系统(专利申请US20130088413A1)图11 具有衍射光栅的近眼显示设备(专利申请WO2013062654A1)图12 具有激光对准传感器的HMD(专利申请US20130038510A1)图10 全图像扫描镜显示系统(专利申请US20130016413A1)专利申请US20130038510A1提供了一种双眼HMD设备的激光对准传感器。如图12所示,该HMD包括激光源和照片探测器阵列,该激光对准传感器用于测量由于框架沿着旋转轴旋转造成左右显示器对准不准问题。二、物体捕获技术谷歌公司的谷歌眼镜,其一个重要的功能是即时发现用户感兴趣或可能关注的目标对象,尽快获取该目标对象的信息,并为用户显示。谷歌公司从多个角
2014年第1期50中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis图13 基于光流分析捕获目标对象(专利申请US20120287123A1)图14 基于光学闭塞的物体捕获技术(专利申请US8199974B1)图15 基于虚拟键盘的人机交互方式一(专利申请US20130027572A1)图16 基于虚拟键盘的人机交互方式二(专利申请US20130016070A1)度对谷歌眼镜如何捕获感兴趣的目标对象进行了专利布局。专利申请US20120287123A1通过以下方式实现捕获感兴趣的目标对象:如图13所示,对接收的视频进行光流分析,通过判断光流的变化预先确定用户可能感兴趣的目标,从而提前搜索该目标相关信息,为用户显示。三、人机交互技术对于小巧的谷歌眼镜来说,提供便利的人机交互方式也是其关键技术之一。为了满足用户的多方位需求,谷歌公司为谷歌眼镜提供了触控键盘、语音交互、姿势识别等人机交互方式。1.基于触控键盘方式的人机交互由于谷歌眼镜不能够提供像传统的智能终端那样的触控键盘,对于目前人机交互不可或缺的触控键盘,谷歌公司提供了多种便利于用户的创意。在专利申请US20130027572A1中,如图15所示,当用户的手接近虚拟键盘或操作虚拟键盘时,在屏幕上显示键盘以及手的操作,使用户直观地确定输入位置。专利申请US8199974B1使用光学闭塞识别目标对象,HMD可以询问用户以哪个物体作为参考物体,当检测到参考物体的特性变化时,确定使其变化的物体为被检测的目标,HMD对该目标采取相应的措施。例如图14中的手为参考物体,名片为被检测的目标,当检测到名片使手发生变化时,HMD确认名片为被检测的目标,自动对名片进行文字识别,获取相关信息。专利申请US20120290401A1则通过传感器获取场景图像,同时获取用户眼动方向信息,通过图像识别算法识别用户正在观看的目标,即通过眼动识别感兴趣的目标。
2014年第1期51中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & Analysis图17 基于语音控制的人机交互(专利申请US20130018659A1)图18 具有骨传导扬声器的谷歌眼镜(专利申请US2013022220A1)图19 基于手势控制的人机交互(专利申请US8179604B1)在专利申请US20130016070A1中则采用类似projection keyboard技术,如图16所示,通过激光将虚拟输入设备如虚拟键盘投影到表面,如手上,使用户采用类似传统的方式操作虚拟触控界面。其中虚拟输入设备包括一个投影仪和照相机,投影仪将虚拟输入设备投影到手上,照相机捕获用户选择的虚拟输入设备的菜单,同时照相机检测“显示器手”的运动,以将投影仪准确对准到运动的手上。2.基于语音控制的人机交互专利申请US20130018659A1提供了一种语音控制方式。如图17所示,谷歌眼镜根据接收的语音生成相关的文字,基于接入文档的历史或数据库确定语音相关文字的上下文,基于估计的语音相关文字确定要执行的动作和上下文,该动作可包含一个命令或搜索请求,基于确定的动作执行相关操作,如呼叫搜索的人。通过该种方式,可以将用户的双手解放出来。专利申请US2013022220A1则在谷歌眼镜中配置了间接骨传导扬声器。如图18所示,其中包括位于侧臂508-R的振动传感器514,振动传感器基于音频信3.基于姿势动作识别的人机交互专利申请US8179604B1提供了一种手势控制方法。如图19所示,其中在手可穿戴的物品表面包括一个红外反射面形成的特定的表面图案,该图案几乎是不可见的,HMD配有红外线照相机,用于检测红外反射面的图案,从检测的红外辐射解码该表面获取一个标识,确定其是否可与HMD预先设置的标识匹配,若匹配,通过红外检测测量该特定表面图案相对于HMD的位置和运动,以跟踪手可穿戴物品的位置和运动,从而进行手势识别,通过识别的手势执行相应的功能。号进行振动,由于振动传感器位于外侧,其不会直接接触用户,而是间接振动,将音频传到用户。4.纠正人机交互输入错误专利申请US8209183B1提供了一种对输入信息进行纠错的方法。用户通过键盘、音频等方式发出指令时,常存在书写错误或者发音不准的问题,为了为用户提供准确的操作,该专利申请提供了文本纠错功能。如图20
2014年第1期52中国发明与专利CHINA INVENTION & PATENT 统计分析 Statistics & AnalysisWO2013052855A2提供了一种方法,该方法中HMD判断其自身与现实世界的物理物体的距离,当确定距离后发起碰撞避免操作,如在显示器上弱化显示的虚拟物体(如只显示不干扰用户看到现实物体的部分)以减少对看到现实物理物体的阻碍,并在显示器上提示用户可能碰撞该物体,从而降低使用HMD显示图像对可视范围造成干扰的危害。此外,如果一副装载着大量用户私密信息的谷歌眼镜丢失,对用户来说是一大损失,而且由于信息的泄露,对用户的财产和人身安全也会造成一定的影响。为此,谷歌公司没有忘记为这一充满个人信息的智能设备增加一把安全锁。专利申请US8223024B1提供了锁定HMD的功能,其通过检测HMD设备运动数据的不正常,确定为非认证用户携带HMD,则对其进行锁定,防止信息泄露。五、应用一款智能产品的成败不仅仅在于其自身的功能,在网络发达的今天,将其连接于网络中,充分利用网络的功能,以及提供多样性的应用服务,也是其不可或缺的利器。向来关注应用的谷歌公司,在智能眼镜的应用层面也申请了大量专利:专利申请US8430310B1提出了一种在智能控制方面的应用,在该应用中通过被控制设备与HMD直接的信息交互直接识别和认证HMD用户,从而实现对被控制设备的智能操作。专利申请US8175297B1将散落在环境中的谷歌眼镜组成为adhoc网络,通过组成的该网络为用户提供服务。如在本专利申请中,在HMD如眼镜上安装音频传感器感知周围环境的声音,当服务器从移动设备接收到请求声音的请求时,根据请求的位置和音频传感器的位置,确定音频传感器的adhoc组,音频传感器将感知的声音发送到服务器,服务器根据音频传感器感知的声音估计出请求位置处的音频。专利申请US8332424B2则提供了一种信息共享方法,其中将例如照片和关于该照片的虚拟标签如评论发送到服务器,对该图片进行索引,共享评论信息。专利申请US8190749B1对由于谷歌眼镜性能造成的使用限制进行了弥补,该专利申请中提出将谷歌眼镜与现有的设备进行对接,将谷歌眼镜的应用转移到第二设备上,由第二设备执行相应的操作。(作者单位:国家知识产权局专利局专利审查协作北京中心通信部;第二作者、第三作者所作贡献等同第一作者)责任编辑 王瀛所示,针对不同输入的输入方式设置有不同的纠错程序,将用户的输入转换为文本,对文本进行纠错并显示,用户可从显示器提供的多个选项中选择正确的选项。图20 人机交互输入错误的纠正方法(专利申请US8209183B1)四、其他结构和功能专利申请US8303110B1中HMD的鼻托具有涂覆层和电磁可控硬度的液体,当检测到施加到鼻托的压力或者运动,执行在液体中产生磁场的操作,从而控制鼻托的硬度,其中可通过人机接口接收加强或减弱鼻托硬度的指示。专利申请US8384617B2中HMD的鼻托具有传感器,该传感器指示HMD是否正在使用,以调整设备的功率,可达到有效降低能耗的效果。专利申请US8235529B1提供了一种当HMD锁定时如何解锁的方法,其中在屏幕上显示运动物体,当眼球运动路线与运动物体的运动路线相同时,则解锁眼镜,可正常使用。由于HMD显示的虚拟图像会对用户的可视范围造成影响,为了保护用户的安全,专利申请