|
标题:一种基于CLIP和动态语义优化的文本到3D形状生成方法 作者:袁康1,2 王旭智1,2 万旺根1,2;孙学涛2;张振3 作者单位:1 上海大学通信与信息工程学院,上海 200444;2 上海大学智慧城市研究院,上海 200444;3 上海健康医学院附属嘉定区中心医院,上海 200444 关键字:文本到3D形状生成;CLIP;动态语义优化;特征空间对齐;生成一致性 摘要:文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而,由于文本与3D形状在模态上的显著差异,以及高质量3D形状生成中存在的语义一致性和多样性挑战,目前的方法往往难以在生成质量与文本一致性之间取得平衡。提出了一种基于CLIP和动态语义优化的文本到3D形状生成方法。该方法通过构建动态语义优化模块,实时分解并调整文本特征的语义权重,使生成的3D形状更符合输入文本的描述。将动态语义优化嵌入现有的两阶段特征空间对齐框架中,显著提升了文本到3D形状生成的精度和质量。实验结果表明,与现有方法相比,该方法在生成质量、一致性方面得到了提升。 |