top of page
  • 作家相片Junce Wang

锐评 Apple Vision Pro 发布会—— VR挺好,AR和交互不行

刚刚看完了WWDC,不是很看好万众瞩目的Apple Vision Pro。这东西本质是VR头盔,带了一堆传感器和高清屏幕,做了个假的能显示佩戴者眼睛的“Eye Sight”,提供一种在 AR 的现实环境感知和 VR 绝对沉浸感中的无缝切换体验。

下面就来说说各个点:


1. 作为VR设备的硬件指标够强

作为VR产品,绝对硬件指标应该是碾压现有竞争产品了,的确在很多指标上可以达到量变产生质变。23M像素,单眼应该有3k*3k+的分辨率,这一点对VR中的文字阅读、现实环境模拟显示的需求,都超越了过去vr设备因为硬件性能不达标而无法满足基础用户体验的情况。MiniLED 的色彩也是能极佳地还原现实环境模拟显示的光影效果,这一点也是AR体验的基础。不过就是不知道FOV有多少,看屏幕接近方形,FOV应该不高,沉浸感应该会大打折扣。


2. 体验未知但很酷的人机交互设计

各种HCI层面的体验优化,比如厚度、重量、佩戴舒适感啥的,我不置可否,这些东西只有实际上手体验过才知道。但是一些想法还是挺创新的,例如Eye Sight这种让别人看到你的眼睛的功能,第一次在XR设备中考虑到了用户以外的人。这些功能有没有用我不好说,但确实挺独特挺酷的。


3. R1实时传感器很强,但对于AR体验还不够 

R1芯片全传感器实时处理时间小于12ms,换算下来应该是目标刷新率在 90Hz,这有点美中不足。对于纯VR模式我觉得够用,但是对于有透传需求的AR模式来说,至少120Hz才是体验量变的阈值。我预测这东西上市后,AR模式晕动症的情况会很多。


4. AR 界面中,用强调光影要素是个好的设计

AR 界面设计中,对空间物件大量使用了光影要素,这是个在XR中很创新的设计理念。我对这点表示期待,可能会成为AVP的“高级感”的一大来源。能做到这一点,应该是基于M2强大的图形计算能力,估计别人抄这种界面也抄不来。

哦顺带一提,这个全是圆圈图标的主菜单,PSV借尸还魂了()苹果还是那么爱索尼()



5. 强大的图形性能,预计碾压其他竞品,但没有代差

VisionOS 在底层渲染管线上似乎有专门的适配,还和Unity深度合作。我不好说这些优化是不是其他XR系统就已经做过的事情,但至少M2硬件性能摆在那,哪怕软件优化和其他XR系统一样,凭借硬件就能带来碾压的图形展示效果了。但似乎顶天了也只是移动端水平,看演示的那几个3D demo,好像也连PBR都不是,和现有的AIO VR头显还没有代差,估计在这部分上不会有多惊艳。但是macOS这次加入了很多为了游戏优化的东西,不知道是不是为了未来桌面驱动VR的布局,考虑到R1对传感器计算的优化,核心芯片的算力都释放给图形计算,让M系芯片的VR图形体验达到甚至超过桌面PC,不是不可能——当然,对现在来说,这些想法都是画大饼。目前能期待的这东西,就是个和现有VR一体机图形体验差距不大的,显示分辨率更高的产品,仅此而已。


6. 沉浸感具有无级调节的功能,想法很创新,但体验不好说

AVP 强调沉浸感的无级调节,甚至专门为此做了一个单独的硬件旋钮。这也是在过去XR体验中很少见的思路,算是个很创新的想法。其他的XR产品,要么是在现实环境交互上做到头,采用物理透传显示设备,要么是在完全沉浸感上做到头,做成单纯的VR产品。AVP这种“我全都要”的想法,在交互体验上,我感觉很容易造成割裂的体验。AR和VR在交互基础逻辑上就有巨大差异,不知道苹果能不能解决好这个问题。而且前面也说了,用VR技术模拟AR体验,刷新率不达标,这可能导致AR模式基础体验不佳,这个头盔最后可能变成一个纯粹的VR体验为主的产品,AR的部分只是作为“不用把VR头盔摘下来打断沉浸感体验”的一个替代解决方案。这么说吧,能戴着AVP,无缝流畅地玩手机,我觉得它的AR模式就算成功了(笑


7. AR 模式使用场景受限

AR模式的使用场景,个人感觉受限。发布会上展示了三种主要的使用场景。:

一,是空间多屏幕办公,这一点,从设备成本来讲,不在意显示效果的办公场景肯定不如买个办公显示器便宜,在意显示效果的办公场景,肯定得用正经的显示屏(XR设备原始分辨率再高,也会经过大量的镜头空间畸变,失真度对于在意显示效果的办公场景是不可接受的),而至于拿这东西开会——笑死,真有人会拿这东西开会么。因此我想不到什么常规办公场景是“一定要AR显示才能办的”,对于现有的XR办公需求已经渗透的领域,如医疗、汽车、房产等,你这个3000刀的头显能做的事情,人家1000刀的Quest Pro也能做到,凭啥多花两倍的价格买你这东西?

第二个场景,是3D空间照片——那个宣传视频上,孩子过生日,家长戴着这么个高达形态出击的东西拍照,孩子怎么可能对你这东西露出笑容?哪怕是有eye sight,戴着这么个头盔和现实里的人面对面交流,不比你戴着AirPods Max和人交流好到哪去,这都是在和人面对面交流时,有严重阻碍的东西。所以这东西就不适合进行室内互动拍照。那室外拍照呢?苹果自己都没怎么展示室外用这东西的情景,可能是传感器不够强无法支撑无限空间AR体验,或者电池受限无法支撑室外使用。而且,带着这个东西出门,我觉得绝大多数用户还是很抗拒的。它不适合作为casual user的3D camera,如果要拍专业级的3D照片或视频,那有的是专业的录制设备。因此,这东西最大的用途,顶多当个3D显示设备,如果iPhone/iPad能拍出适合AVP查看的3D照片,哪这点来说到还是有点用。(所以进一步猜测,iPhone 15 可能有这样的功能,不论是平行双摄还是机器学习3D重建,至少要有方便一般用户获取3D照片的途径,AVP这个功能才有实用性)。

第三个场景,是当作私人影院看电影,尤其是3D电影。这一点我觉得倒是挺靠谱的用途,尤其是考虑到硬件分辨率很高,这一点体验相比现有的XR设备,说不定会有量变产生质变的体验。但唯一令人担心的是续航够不够,我看那个外挂电池也就俩小时——看完一场电影刚好没电?真是这样的话,这个使用场景的实用性也要打上问号了。


8. 操作方式上干掉了6DOF控制器,这比从手机上砍掉3.5mm耳机口风险更大,甚至可能导致产品的失败

纯语音/注视点/手势交互,我极度不看好这种交互方式,尤其是这东西支持iOS应用的情况下。用过quest的手势和控制器之后,就会发现手势控制的精准度远低于控制器,就算苹果传感器nb,R1芯片补偿算法nb,系统级交互有如iPad OS的鼠标指针那样的吸附补偿设计,这些现有手势交互的可能存在问题我们都假设苹果能解决掉,那手势交互相比控制器交互也有一个巨大的弱点——累。控制器你可以只转动手腕,通过旋转控制器的朝向,快速地在空间中从一个注视点移动到另一个注视点,“交互空间的移动距离/物理空间的移动距离”的比例可以是一个很大的值,就像鼠标的高DPI一样。但不论是手势交互还是眼球注视交互,都没有控制器那般快速且精准的旋转操作方式,这两种操作的那个比值,几乎都是1:1的,你想在交互空间中移动多少距离,物理空间中也就需要移动多少距离。这样的交互方式,带来的用户负担是巨大的。尤其是,在我看到他们的AVP的AppStore还是采用了和平面显示设备无异的界面设计,加上他们说支持iOS应用之后,我就知道这种交互方式绝对有问题。而且,这样的交互方式,对开发者来说也是极大的挑战,没有6DOF控制器,对于制作沉浸式体验有很大的困难,对现有的OpenXR应用的可移植性也是巨大的负面影响,绝大多数现存的VR娱乐应用和专业应用,因为缺少控制器,都无法在AVP上使用。而对于传统的iOS应用,也是很糟糕的体验。因此,纯手势交互,这是我认为的,AVP目前面临的最大挑战,风险大到可能让这个设备“整段垮掉”的程度。我很好奇苹果到底会用怎样的方式解决这些问题,还是苹果有自信像手机砍掉3.5mm耳机接口一样,让XR设备砍掉6DOF控制器也变成新的行业标准?前者得罪的只有耳机厂商和用有线耳机的用户,后者得罪的可是广大的开发者啊。


总结

综上,我对AVP并不看好,它有着超越现有XR产品的硬件参数,有着苹果一贯的对硬件细节的追求,有着独特的AR/VR无缝切换体验,但是在AR层面的应用场景和交互方式上存在着巨大的风险。我原本期待AVP是一个iOS的进一步扩展,就像iPad是大屏iPhone一样,AVP可以作为一个具有3D空间显示的iPhone。但目前看起来,它无法达到这样的期待,在其他方面也没有和现存的XR设备足够有差异。它的定位大概就是“硬件指标最好的传统VR头显(前提是它还支持PC等开放性的平台作为一个纯显示器用)”。这不是一个什么划时代的产品,甚至还不如steam deck的影响大,充其量就是在 deck 发布之后的ROG Ally吧。

213 次查看0 則留言

相關文章

查看全部

初探 ChatGPT:以为是智子,原来只是读了聊天记录

为什么 ChatGPT 说没有记忆能力,却能理解之前的对话?本文是我和 ChatGPT 的一些对话记录,其中谈到了 ChatGPT 的“记忆”的本质,相关的限制,语言人工智能在未来的发展。后续还有一些我个人的理解。

Kommentare


bottom of page