2024-07-12
叠影重重:建筑AR如何真的增强现实而非遮挡现实
AR-chitecture
在施工助手改版的过程中,我们重新考量了在施工现场,用户该如何处理增强建筑信息和真实建筑之间的关系。由此记录一些小小的过程。
"这根管道应该在这里吗?"小李指着平板电脑屏幕上的一个虚拟管道,皱起了眉头。他站在一栋半完工的大楼里,周围弥漫着灰尘和建筑材料的气味。
"让我看看。"他的同事小王凑了过来,手指在屏幕上轻轻一划。突然,虚拟的墙壁消失了,露出了里面错综复杂的管道系统。"啊,原来如此。"小王恍然大悟,"设计图上的管道和实际情况有些偏差。"
这是科技公司在推广AR技术应用于建筑领域时常用的一个场景描述。然而,现实中的应用往往没有这么理想:AR建筑模型可视化面临着一系列技术与设计挑战。其中一个较少被讨论的问题是:虽然主要目标是将渲染的建筑模型精确地叠加在真实建筑上,但这不可避免地会导致真实建筑的部分遮蔽,并可能干扰用户的视觉感知。
理想状态下,我们追求的是完美融合真实建筑和渲染模型的视觉效果。然而,受限于当前技术,这一目标尚未实现。我们必须在视觉效果和功能性之间做出权衡,关键在于优化元素的显示与隐藏策略,以及渲染方式。本文将深入探讨这些核心技术问题。
理想中AR查看的的情况
为了分析这一问题,我们提出了两个关键维度:现实-模型维度和信息-美观维度。在现实-模型维度上,一端是纯粹的现实环境,另一端是完全的3D模型视图。AR技术的核心在于在这两个极端之间找到最优平衡点。在有限的移动设备屏幕上,除了AI生成的建筑模型外,还包括用户的手部、周围环境等多种视觉元素。这就需要我们在现实与模型之间进行精确的数据融合和渲染优化。
这种优化旨在实现模型与现实环境的无缝集成,同时保持现实世界的上下文信息。值得注意的是,AR的目标并非创造一个完全虚拟的环境(这是VR的领域),而是增强用户对特定区域的感知,即渲染模型覆盖的部分,同时保持对周围环境的awareness。
在信息-美观维度上,我们面临着数据可视化与视觉美感之间的trade-off。用户在使用AR应用时,可能需要获取精确的技术数据,也可能更注重视觉体验。前者需要通过文字标注或图形符号来呈现,后者则需要高质量的3D渲染、平滑过渡和自然的光影效果。这两种需求在技术实现上存在矛盾,尤其考虑到AR的背景是动态变化的真实环境,而非静态的白色或黑色背景。如何在有限的屏幕空间内平衡这两种需求,是AR技术面临的另一个重要挑战。
虚与实:现实与模型
实现现实与模型之间的自然过渡是AR技术的核心挑战之一。通用3D软件中的某些技术可以为我们提供解决方案。
透明度调整
半透明显示是一种常用的可视化技术。与完全不透明的模型相比,半透明渲染能够揭示内部结构,这在AR建筑应用中尤其有价值。用户可以在完全不透明(用于外观检查)和50%透明度(用于内部结构分析)之间进行切换,以观察线路、管道和立柱等内部元素。
然而,半透明渲染也带来了技术挑战。当透明度设置为中间值时,用户的认知负荷可能会增加。这是因为多个半透明层的叠加会产生复杂的视觉效果,需要较高的空间认知能力来解析,特别是在与真实建筑环境结合时。这种复杂性可能会影响用户体验和信息传递的效率。
构件隐藏
除半透明显示外,另一种有效的可视化方法是选择性隐藏构件。这种技术在建筑领域尤为实用,因为不同专业(如结构、机电)的施工过程通常是分离的。用户通常只需关注特定的结构部分,因此可以选择性地隐藏其他构件。这种方法可以显著降低建筑模型的视觉复杂度,特别是在检查管道系统时。例如,通过隐藏立柱、楼板和天花板等结构元素,用户可以清晰地观察管道之间的空间关系,以及管道与现场环境的相对位置。这种选择性显示技术不仅提高了模型的可读性,还能有效地突出重点信息,从而优化AR中的建筑信息呈现。
除构件专业分类外,我们还可以基于构件的元数据进行隐藏操作。建筑信息模型(BIM)采用树状结构,每个末端节点代表一个构件。这些构件不仅包含其在模型层级中的位置信息,还可能携带其他属性数据,如管道长度、材料规格等。通过解析这些元数据,我们可以实现更精细的构件筛选和隐藏功能。
此功能的实现依赖于后端的高效数据读取能力,以及设计师对用户需求的深入分析,以确定最有价值的筛选条件。这些筛选条件不仅限于BIM模型中的固有属性,还可以包括与施工管理相关的动态信息。例如,通过集成施工管理系统,我们可以为构件添加如"施工中"、"待施工"、"已完工"、"验收通过"、"验收不合格"等标签。此外,构件与工单或文档的关联关系也可作为筛选依据。
这种基于丰富元数据的高级筛选功能,使AR可视化系统能更紧密地结合实际施工过程,提供更具实用性和针对性的信息展示。
剖切
剖切是一种关键的模型操作技术,用于按特定平面隐藏模型的部分结构,以揭示内部细节。这种技术在建筑设计和模型检查中广泛应用,可以提供建筑内部结构的独特视角。
在3D软件环境中,剖切通常有两种主要实现方式:
基于坐标轴的剖切:沿XYZ轴的特定位置进行剖切。
基于面的剖切:选择特定面,沿其法向量方向进行剖切。
然而,在AR现场应用中,这些方法面临着特殊的技术挑战。坐标轴剖切在复杂多变的现场环境中效用有限,因为目标平面往往不与标准坐标轴对齐。而基于面的剖切则引发了面选择的问题:在动态的AR环境中,如何精确地选择和定位目标平面?这个问题涉及到空间定位算法、用户交互设计以及AR设备的硬件能力等多个技术层面。
在PC环境中,面选择操作相对简单,通过鼠标悬停即可触发面方向的快速计算。然而,在现场AR应用场景中,面选择的复杂度显著提升。操作者需要同时处理现实环境和虚拟模型中的面,这两者可能存在相互遮挡或隐藏的情况。虽然虚拟模型面的选择体验可能与PC端相近,但现实环境面的选择则面临更大挑战。方向指示浮标的实时计算依赖于周围环境的整体判定,导致其精度较低,尤其不适用于复杂表面。该技术在平整简单的表面(如墙面、地面、桌面等)上表现较好,但在复杂环境中的应用仍需进一步优化。
值得注意的是,构件隐藏和透明度调整仅涉及现有元素的显示控制,而剖切操作则会生成新的视觉元素——剖切面。若剖切面缺乏适当的渲染或标识,可能导致用户对建筑剖切效果的理解困难,尤其是在大面积剖切时。为提高剖切效果的可识别性,可借鉴建筑设计软件中的渲染技术,如使用斜纹纹理。关键是确保用户能清晰辨识剖切面的存在和位置,从而准确理解建筑结构。
深度感知遮挡
最新的AR技术利用深度感知设备(如LiDAR)来实现更精确的环境理解。这种方法通过测量周围环境的深度信息,使AR模型能够与实际环境进行深度比较,从而确定正确的遮挡关系。这种技术突破了传统AR渲染的局限性,使虚拟对象能够更自然地融入现实环境。
然而,这种深度感知技术在应用中也面临着权衡。一方面,它提高了AR体验的真实感和沉浸感;另一方面,它可能限制了某些增强现实效果的实现。例如,在建筑可视化中,深度感知可能阻止用户透视墙壁查看隐藏的管道系统。
隐藏构件查看管道,可是管道怎么到墙壁前面去了?
为解决这一矛盾,可以实现两种渲染模式:一种是基于深度信息的真实遮挡模式,另一种是忽略环境遮挡的全透视模式。用户可以根据需求在这两种模式间切换,但目前技术尚不支持同时实现两种效果。这种双模式设计反映了AR技术在真实性和信息丰富度之间的平衡考量。
让我们回顾一下在真实和虚拟之间进行调节的四种常见方式:调整模型的透明度、调整构件的显隐、进行剖切以及进行深度遮挡。我们需要了解用户在不同场景下对这四种配置选项的需求,让他们通过尽可能少的配置得到自己想要的效果。
感受与计算:美观和信息
美观与信息的兼容性在AR建筑可视化中有着天然的矛盾。这种矛盾源于视觉呈现方式的本质差异。以建筑图纸为例,渲染图和技术图分别服务于不同目的:前者侧重于视觉美感,后者强调信息精确性。这种分离反映了信息密度与视觉复杂度之间的权衡。
在技术层面,这种矛盾体现在数据表示和图形渲染的不同需求上。高保真度渲染需要复杂的光照计算和材质模拟,而精确的技术信息则要求清晰的线条和标注。这两种需求在计算资源和图形处理上存在冲突,尤其在实时渲染的AR环境中更为突出。
此外,人类视觉感知的生理限制也是一个关键因素。我们的视觉系统在处理精确几何信息和感知整体美学效果时采用不同的神经通路,这导致同时优化两者在认知上存在困难。因此,在AR应用中,需要在视觉呈现方式上做出技术性的权衡和优化。
美观的模型覆盖
在AR建筑可视化中,同时呈现美观和信息内容存在技术挑战。当前技术限制,尤其是在平面设备上,要求用户在视觉美感和信息密度之间做出权衡。这一问题可能在AR眼镜技术成熟后得到缓解。
在"美观-信息"光谱上,美观端侧重于高保真度渲染,包括复杂纹理、自然色彩和光影效果。这种呈现方式虽然视觉上令人满意,但降低了构件间的区分度,不利于信息标注。
向信息端过渡时,可采用高对比度色彩编码系统。这种方法牺牲了自然美感,但显著提高了构件识别效率,类似于工程图纸中的颜色编码策略。
信息与美观的结合
信息端极致是纯粹的数据可视化,如CAD风格的线框模型配合详细标注。在此模式下,模型的美学价值让位于信息的精确传递,适用于技术分析和精确测量场景。
纯粹的信息传达
需要强调的是,AR环境下的可视化与传统显示方式存在本质差异。AR背景是动态变化的真实世界,而非静态的纯色背景。这一特性对文字和线框等视觉元素的呈现提出了更高的技术要求。为确保信息在各种光线条件下的可读性,需采用特殊的渲染技术。例如,实现高对比度文字、添加描边效果或应用动态阴影等。这些技术优化旨在克服复杂背景和变化光线对信息传递的干扰,从而保证AR环境中视觉元素的清晰度和可识别性。
总结
上文中,我们简要谈论了AR模型可视化的两个关键维度。这个二维坐标系为模型呈现提供了一个理论框架,有助于精确定位用户所需的模型类型。在不同模型或任务间转换时,需要考虑状态转换的路径以及可能的优化方法。
例如,透明度的调整可采用非线性方式实现。一种技术实现方案是从完全实体逐步过渡到蜂窝状结构,随后通过算法控制孔隙率的增加,最终实现完全消失。这种渐进式透明化技术可能有助于降低用户的视觉认知负荷。
anyway,先看看这张图,首先知道你在哪里。没有可以描述一切的图像,至少对人类来说不行。