草图建模综述.doc
《草图建模综述.doc》由会员分享,可在线阅读,更多相关《草图建模综述.doc(29页珍藏版)》请在三一办公上搜索。
1、基于草图的建模综述摘要:传统建模工具的用户界面都基于WIMP的。尽管这些界面功能强大,但对于新手而言,这些界面的使用非常麻烦,令人畏惧。使用这些工具创建一个复杂模型需要相当多的专业技能和精力。近来,一个趋势是引入更方便和自然的用户界面,基于草图的用户界面(Sketch Based Interface and Modeling, SBIM)就是其中之一,其目标在于允许用户在建模过程中使用自由手绘草图,包括从粗略模型直到完整细节的构建过程。由于模糊性的存在,将一幅2D草图映射到3D模型是一个非常困难的任务。本文根据SBIM解释草图的策略选择进行分类,包括三种基本方法:创建3D模型,给现有模型添加细
2、节及变形和操纵模型。文中对基于草图的用户界面在3D图形建模中的应用进行综述,对现有工作进行介绍和分类,总结了草图获取、过滤和解释技术;也介绍了一些SBIM的典型应用,讨论了本领域的主要挑战以及一些开放性问题以供研究者在今后的工作中参考。Luke Olsen,Faramarz F. Samavati,Mario Costa Sousa,Joaquim A Jorge,Sketch-Based Modeling: ASurvey,Computer& Graphics, 2009,Vol.33, pp85-103.Survey of Sketch-based modeling1、引言从严格意义上讲,
3、“所有人都会画”并不是一个正确的论断,但是其揭示了一种普遍存在的视觉通信能力。这也是为什么古人通过象形文字讲故事,而每个会议室的墙上都挂着一个白板的原因。绘制草图是一种直接而快速的思想交流方式:只要看到少量的笔画,人们的脑海中便可勾勒出复杂的图形。在计算机建模领域,在纸上绘制草图在设计初期(即早期原型设计阶段)经常发生,此后这些描述性设计草图由熟练的3D绘制人员转换为3D模型(如图1所示)。因此,模型创建是产品流水线的一个主要瓶颈,这一过程需要大量人手以创建复杂多变的形状以及错综复杂的内部关系。当前一些高端建模系统(如Maya1、SolidWorks2和CATIA3)都提供功能强大的精确几何模
4、型构建和操纵工具。这些系统通常采用WIMP界面范例,即:用户需要从菜单和浮动窗口中选择操作类型,在对话框中输入参数以及移动控制点等。近来在建模工具界面的一个趋势是引入自动(或辅助)直接从草图到3D模型的转换技术,即面向模型创建的草图交互界面(sketch-based interface for modeling,SBIM)。这类界面的主要研究问题是:计算机如何在三维空间中理解和解释用户绘制的草图?多年来研究人员一直在考察这个问题。人类视觉系统可以从简单的图像或草图,甚至是从简单的线画图形(并没有阴影线索)中理解复杂的形状,但是人的感知过程是如此的简单,却使得人们很难对这一过程进行理解和形式化。
5、开发一个能够直观地模拟人类观察能力的SBIM系统需要考虑感知和认知问题。事实上,SBIM处于多个不同领域的交叉点,包括计算机视觉、人机用户界面以及人工智能。尽管这一研究主要是由计算机建模领域发起,但是更强大商用计算机硬件的出现以及各方面研究成果推动了该领域取得了令人兴奋的成果。SBIM研究的最终目标是在原有基于WIMP系统的基础上整合草图交互方式,构筑更实用的建模系统。使用这类系统时用户以渐进的方式构造和修改模型,从初期的概念到详细精确的最终模型。尽管目前对于SBIM有诸多的研究,但是工业界并未完全支持SBIM,因为SBIM不能满足建模任务的所有功能要求。商用建模工具包中支持手绘草图的有Arc
6、hipelis Designer4和Sunny3D5,其它一些程序,如ZBrush6和MudBox7等,也支持建模人员使用刷子以笔画形式在模型表面绘制细节。草图交互界面可追溯到Sutherland的SketchPad系统8,该系统使用光笔作为输入设备在屏幕上直接创建和操纵对象,这种交互方式先于目前流行的鼠标交互方式多年。SketchPad系统预见了许多SBIM会面临的挑战,包括:如何接受和处理用户输入、解释用户输入(作为一个对象或者操作)及表示结果对象。现在的系统主要在SketchPad基础上提升其处理的自动性:SketchPad用户必须显式指定所有的几何信息,而现在的系统可使用更优化的算法减
7、轻用户负担及提高计算能力,进而可以自动的从2D输入推导3D形状。基于草图的技术可被用于多种建模任务,其中的一些将在第7章进行讨论。本文(9中的修改和扩展)对基于草图的用户界面在3D几何建模中的应用进行综述。SBIM的主要挑战在于草图解释,对此,我们分为三种主要方法:创建3D模型、(在现有模型上)添加细节及模型变形和操纵。图2总结了SBIM应用的主要流程。第一步是从用户输入获取草图(第三章);接着是草图过滤,对草图进行预处理和一些变换(第四章);最后是草图解释,以得到3D模型的具体描述(或者解释为对模型的操作)。本文的组织如下:第二章简要讨论了感知在SBIM中的作用,第三到五章详细描述了SBIM
8、流程的每一个阶段,本文包括了对两个重要问题的讨论:表面表示(5.4)和界面设计(第六章)。第八章总结了本领域面临的挑战和一些开放性问题。2、感知的作用人类视觉系统非常复杂,我们考察该系统是因为它在我们生活中一直非常容易地运行。对认识科学的深入讨论已经超出本文和我们的知识范围,该领域的一些观点对SBIM系统的设计已经产生了一些影响(隐式或显式),毫无疑问在今后也会产生影响。毕竟人们对形状的感知影响他们如何进行绘制:感知和交流是我们视觉智能的两个侧面。我们视觉系统必须考虑的基本问题是“眼睛所看到的图像可以有无数种可能的解释”10。考虑一个最简单的仅包含一个点的草图,尽管我们已经知道这个点准确的2D
9、坐标,然而这个草图可以解释为任何一个经过该点和观察者眼睛的直线上的点的子集。图3示出了非平凡(non-trivial)线画图形问题,其中展示了三种与立方体具有类似投影的物体,这类物体可以有无数种。尽管我们大脑的逻辑部分可以相信绘制的内容不一定是立方体,但是我们的视觉部分并不一定这么认为。我们尽可能多地尝试,这个物体却总是被看成是立方体。这一实例可以说明我们视觉系统的一些简单的支配规则。我们如何把图3解释为立方体,而不是其它无数种候选呢?我们可以观察图3中三个混淆模型,这三个模型的轮廓线都可投影为类似于立方体的投影,但只有立方体本身符合我们的视觉规则。Hoffman10将其它的候选称为“无意视图
10、”(accidental views),因为视点的微小变化都会揭示这些模型不是立方体。换句话说,“无意视图”并不稳定(unstable),而物体的大部分视图在微小变化下仍然是稳定的。我们的视觉系统更偏向于稳定的解释。现在我们考虑艺术家正准备绘制上述的一种非立方体物体。他们会不会选择从“无意视图”绘制这个物体呢?并不一定,因为他们自身的视觉规则会发觉这是一个立方体。因此,尽管可以有无数种方式来重构一个绘图,“自身的视觉系统是有偏的。它只构建那些符合规则的3D世界”10。视觉规则可以帮助我们解释从未见过的图像,但是它们也会限制我们,使我们只看到最简单的物体。我们的记忆中有非常多的形状用于解释各种图
11、像12,并应用于从未见过的复杂事物。例如,当看到运动汽车的一幅图像或者仅仅只是轮廓,我们可以很快的判断出其属于汽车类别,并推导出其近似的几何、对称以及大小信息。这点突出了识别(recognition)和重建(reconstruction)的一个重要区别13:重建是指根据物体的2D表示创建该物体完整的3D几何信息;识别是一个类似但又截然不同的任务,即基于形状记忆根据物体的一幅图像判断其所属的类别。换句话说,如果视觉记忆可以识别出一个形状,我们可以更简单的重建该形体。否则,对物体的重建将依赖于视觉规则系统。对称是许多物体的另外一个重要属性。从2D表示中发现或推导对称性可为3D重建提供非常有价值的信
12、息。这里不仅包括“真”对称,也包括对称3D物体的任意投影。Tanaka等14讨论了三种对称:真实对称(real symmetry):对称轴是图像平面内的一条直线;斜对称(skewed symmetry):对称轴是穿过图像平面的一条直线;一般对称(generalized symmetry):对称轴是3D空间中一条自由线。图4展示了这些概念。感知的一些概念可以帮助我们理解SBIM面临的挑战以及设计中所要做出的决策。在第五章中我们将看到SBIM系统基于视觉记忆和规则处理简单图像中模糊性。在第8章中我们也会看到,理解我们的感知也会提高SBIM系统所需要的基于软件的感知。3、草图获取SBIM系统的最基本
13、操作显然是从用户获取草图。基于草图的输入设备的一个关键特性是支持自由手绘输入。标准的鼠标符合该定义,但是更类似于在纸上自由绘制的设备(如平板显示器)可以更好地帮助用户进行绘制。此外,显示和输入耦合在一起的设备更适合于自然的交互(如图5)。实际的纸笔是一种非常有表现力的交流媒介。用户不仅可以使用整体的构成也可以通过压力和笔画的风格来表达信息。从用户角度看,这种媒介通过纸的质地纹理提供用户反馈,用户可以感受到笔在纸表面的刮擦(例如:在餐巾纸上绘制会有一种与普通纸所不同的触感)。有一些研究致力于将上述各方面转移到数字领域。目前许多平板设备具有压力敏感性,其不仅仅可以提供笔端的位置信息,也可以提供用户
14、在平板上的压力大小信息。一些设备还提供笔的方向性数据。触觉(Haptic)设备15是一种更新的研发成果,其可以通过笔设备本身提供用户直接的反馈,如:低频振动以模拟笔和纸之间的摩擦。另外一些可用的输入设备包括平板显示器16,甚至虚拟现实设备17。这些设备都致力于提升用户的沉浸感,但它们往往又比较笨重并可能降低沉浸感。例如,触感输入笔被附着到胳膊上以提供力反馈,但这种方式又降低了设备与笔的类似程度。随着这些硬件越来越紧凑、便宜以及具有真正的沉浸感,越来越多的人会使用它们。可以认为最终最逼真的界面应该是真正的纸笔与一些主动数字化能力的结合。现有一些商业产品提供对文字和图形的自动数字化18,但到目前为
15、止支持3D重建的几乎没有。离线扫描草图也可作为一种输入,但是这种方法更类似于计算机视觉中图像识别问题。这种方法在某些特定领域应用可能会有效,如:建筑工程图纸扫描。但对于一般建模任务而言,这一方法非常复杂,目前也缺乏鲁棒的解决方案。交互式系统通常更可行,它可以提供用户更多的信息(绘制顺序、速度等)以及不断的反馈。在本文中我们仅考虑交互式系统。3.1草图表示一个基于笔的输入设备至少需要提供2D坐标系统中的位置信息,通常采用窗口坐标。不同设备的采样速率会有所不同,但无论如何,采样位置都表示连续运动的分段线性近似(图6b)。采样点在间隔上是不规则的,由绘制速度决定。用户在接近拐角处会更加小心,相应的采
16、样点会更加密集,这一事实可用于确定草图的“关键”部分1920。我们把笔画看作是一个时序的点序列,其中:包含了2D坐标和时间戳,笔画的开始和结束由笔落下和笔抬起操作界定。一幅草图包含一条或多条笔画。笔画信息也可以包含压力或笔方向信息,这些取决于目标应用和硬件设备。由于图像处理领域已有大量研究,一些SBIM应用选择基于图像的笔画表示,如图6c所示,笔画被近似表示为一个像素网格。随着输入设备在虚拟纸上移动,它在纸上留下了“墨水尾巴”。基于图像表示的优势有:固定的存储大小以及自动多笔画混合。但是其中草图的时间特性等一些可用的辅助信息被丢失了。在SBIM系统中,“画布(drawing canvas)”这
17、一概念2122被用于将一幅草图嵌入到3D世界坐标系中。最简单的画布定义是指定一个特别的平面,如:x-y或用户指定的平面,并将草图投射到该平面上(例如:将深度或z坐标的值设为0)。活动视平面(active view plane)也可以像画布一样很好的运行,允许用户变换视点从多个角度进行绘制(深度仍然不受约束)。假定输入的笔画是平面对称的并反转视投影,每一个对称的3D曲线是可重获的(recoverable)23。最后的变换是基于当前视点将草图投射到一个已有的3D模型(图7)。一些SBIM系统被设计为面向非经常用户或入门用户,而不是专业用户。为了帮助入门用户进行草图绘制,画布可被替换为图像,用户在图
18、像上进行绘制24252627。图像可被用于辅助绘制草图,其中输入的笔画被附着到图像的边缘25。4、草图过滤在试图解释一幅草图之前,有必要进行一些过滤。原因之一是输入中不可避免的包含一些噪音或者错误的采样点。Sezgin和Davis28给出了两类误差来源:用户和设备错误。绘制技术不熟练,或轻微抖动都会使用户画出不直的线段和不平滑的曲线。第二种错误源是“数字化噪声”,其发生于机械硬件设备对输入进行空间和时间量化的过程:“一个传统的数字化平板分辨率可能低到4-5dpi,而扫描图像的分辨率达到1200-2400dpi。由于用户有时绘制速度很快以致即使设备采样率较高(如100Hz)也只能采集到少量的点(
19、每英寸)”28。即使用户更加仔细绘制,设备错误和采样问题也仍然存在。因此,基于草图系统的输入通常并不是用户意图的完美描述,在进行解释前必须进行“清理(cleaned up)”或者过滤。这一过程可以减少噪声以得到在后续工作中更便于使用的表示形式。下面我们将介绍一些在SBIM领域中常用的过滤方法。4.1重采样和平滑由于输入设备和绘图速度的不同,原始输入笔画采样点之间的距离也不同。重采样(resample)是一种降低输入笔画数据噪音的方法。重采样过程可在绘制过程中同时进行,舍弃一些与前面采样点距离低于一定阈值的采样点,并对样本点之间距离多于一定阈值的情况进行插值。这一过程也可以在笔画绘制结束后进行。
20、根据具体应用的实际需要可以选择线性或者平滑插值(图8a所示)。重采样的一个极端形式是折线(或多边形)逼近,只保留少量采样点,这样可以降低笔画的复杂度(图8b)。例如:在Teddy29系统中将笔画的首点和末点相连以构成一个闭合多边形,同时对笔画进行预处理以使得各边的长度为一预先定义的固定值。另一种简单方法保留笔画的每个第n个点(n-th)。这些方法适合于平滑的输入,否则不会得到令人满意的结果(样本分布不基于局部笔画特征,如边角)。在通常情况下,鲁棒的算法会对由于拟合引入错误数设定一定的范围,在较平坦的区域保留较少的点,在细节较多的地方保留相对较多的点。例如,最大最小法30使得任一点到拟合直线的最
21、大距离保持最小。有一些严格的计算几何方法31可以解决这一问题,但是它们只使用草图输入的位置信息,而草图的时间信息可以用于找出笔画上的感知重要点,如边角。例如,Saga19使用绘制速度来找出“分割点”,并提示用户确认不确定的分割点;Sezgin等20使用曲率(最大值)和绘制速度(最小值)来确定边角点。即使在重采样之后,噪声采样点仍然可能存在。平滑算子可以用于降低噪声,其代价是可能会隐藏输入中真实的中断点。此外还有一些技术,包括对每一个采样点使用局部平均过滤器(也就是将每一个样本点替换为其相邻点的平均值)32,或者Gaussian过滤器(中心加权平均)33。4.2拟合在重采样或平滑之后,草图中仍会
22、有大量冗余的采样点。将草图拟合为其它表示具有双重作用:简化输入以及简化其与其它草图进行比较。事实上,曲线拟合在一些SBIM系统中非常必要,其中重建的表面基于构建型曲线(如旋转的曲面)。曲线拟合是一种简化方法,相比多边形拟合其错误率更低,但是需要更多的计算量。最小二乘方多项式拟合34是一种可选的解决方法,但是参数形式如Bzier3536和B样条曲线373839是更可取的。图8c举例说明了样条曲线拟合。最近,SBIM系统使用了细分(subdivision curve)和变量隐式曲线(variational implicit curve)方法。Alexe等32使用Haar小波变化以得到多尺度的笔画表
23、示;Cherlin等40对原始笔画采样点使用反Chaikin细分将笔画拟合到细分曲线,有效地降低了数据的噪声;Schmidt等16从输入的草图中推导几何约束并拟合到变量隐式曲线。有很多草图输入实例中同时包含分段线性和平滑的部分。将草图的直线部分和曲线部分进行分割,并对前者进行折线拟合以及后者进行平滑处理20364142,有益于系统的后期处理。例如,Sezgin等20使用输入草图的速度和曲率信息进行折线拟合,然后对拟合误差率较高的直线段使用立方Bzier曲线进行拟合,如图8d所示。Yu43指出由于样条曲线在高层次很难进行比较,使用一些基本图元(如:矩形、椭圆和圆弧)进行拟合效果会更好;这也是Sa
24、ga19采用的方法以对自由手绘CAD系统中的形状进行拟合,但是系统也需要用户判断和修正标注。基本图元拟合方法已经在一些SBIM系统4445中得到采用。上面讨论的所有技术都可以说是在局部或者笔画层次进行操作。草图规整化(Sketch Beautification,借用了Igarashi等46提出的术语)是一种在全局层次推导笔画间几何约束(如:线性、平行、垂直、对称等)的技术(图9)。举例来说,当绘制矩形时,系统可以使用直线段拟合每条边,同时推导相邻的边应具有一定的夹角。草图规整化过程可以交互式进行464748,也可以在草图绘制结束后批处理进行49。4.3重绘拟合方法最适合于有一定精度需求的应用,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 草图 建模 综述 doc
链接地址:https://www.31ppt.com/p-2926610.html