机器人根据语音指令自动设计制造家具系统问世
发布时间:2026-01-22 22:31 浏览量:2
麻省理工学院等机构的研究人员开发出一套AI驱动的机器人装配系统,让用户只需简单描述就能制造出实体物品。这一突破性技术有望让设计制造变得更快速、更易于普通人使用。
系统工作原理与核心技术
该系统采用两个生成式AI模型协同工作。第一个模型根据用户的文字描述生成物体的三维几何表示,第二个模型则分析所需物体的功能和几何结构,决定不同组件的安装位置。
系统的核心采用了视觉语言模型(VLM),这是一种经过预训练能够理解图像和文本的强大生成式AI模型。VLM既充当机器人的"眼睛"又充当"大脑",让机器人能够识别几何结构并基于此做出决策。
当用户输入"给我做一把椅子"这样的指令时,VLM会分析椅子的结构,确定面板组件应该放置在结构组件的哪些位置。例如,模型能够判断出椅子的座面和靠背需要安装面板,以便为使用者提供坐靠表面。
人机协作设计流程
整个设计过程始终保持用户参与。用户可以通过给出新的指令来完善设计,比如"只在靠背使用面板,座面不用"。这种人机协作的方式让用户能够引导AI生成的设计,并对最终结果产生归属感。
研究团队认为,由于设计空间非常庞大,通过用户反馈来缩小范围是最佳方式。每个人都有不同的偏好,为所有人构建理想化模型几乎不可能。
一旦三维模型确定,机器人装配系统就会使用预制零件建造物体。这些可重复使用的零件可以拆卸并重新组装成不同配置,大大减少了制造过程中产生的废料。
实验验证与应用前景
研究人员使用这套端到端系统成功制造了包括椅子和书架在内的家具,使用的是两种类型的预制组件。在用户研究中,超过90%的参与者更喜欢他们的AI驱动系统制造的物品,相比其他方法有明显优势。
该框架对于快速原型制作复杂物体特别有用,如航空航天组件和建筑物体。从长远来看,它可以在家庭中用于本地制造家具或其他物品,无需从中央设施运输笨重的产品。
技术局限与未来发展
目前该系统还存在一些局限性。大多数生成式AI模型虽然能够根据文本提示生成三维表示(称为网格),但不能产生具有机器人装配所需组件级细节的统一几何表示。将这些网格分离成组件对模型来说是一个挑战,因为组件分配取决于物体及其部件的几何形状和功能。
未来,研究人员希望增强系统功能,以处理更复杂和细致的用户提示,例如用玻璃和金属制成的桌子。此外,他们还想加入更多预制组件,如齿轮、铰链或其他运动部件,让物体具有更多功能性。
研究团队的最终目标是大幅降低设计工具的使用门槛,证明可以使用生成式AI和机器人技术以快速、易用和可持续的方式将想法转化为实体物品。正如研究人员所说:"我们希望最终能够像人与人交流一样与机器人和AI系统沟通合作制造物品。我们的系统是实现这一未来的第一步。"
Q&A
Q1:这个AI机器人装配系统是如何工作的?
A:该系统使用两个生成式AI模型协同工作。第一个模型根据用户文字描述生成物体的三维几何表示,第二个视觉语言模型分析物体功能和结构,决定组件安装位置。用户只需说"给我做一把椅子",系统就能自动分析并用预制零件组装出成品。
Q2:普通人能使用这个系统制造家具吗?
A:目前还不能完全普及。该系统仍处于研究阶段,主要用于快速原型制作。不过研究团队的目标是大幅降低设计工具使用门槛,让普通人也能轻松使用。未来可能在家庭中实现本地制造家具,无需从工厂运输成品。
Q3:这种AI制造方式有什么优势?
A:主要优势包括:操作简单,只需语音描述即可;制造快速,适合快速原型制作;环保可持续,使用可拆卸重组的预制零件减少废料;用户参与度高,可以随时调整设计。在用户研究中,超过90%的人更喜欢这种AI系统制造的物品。