标题：一种基于CLIP和动态语义优化的文本到3D形状生成方法
作者：袁康1，2 王旭智1，2 万旺根1，2；孙学涛2；张振3
作者单位：1 上海大学通信与信息工程学院，上海 200444；2 上海大学智慧城市研究院，上海 200444；3 上海健康医学院附属嘉定区中心医院，上海 200444
关键字：文本到3D形状生成；CLIP；动态语义优化；特征空间对齐；生成一致性
摘要：文本到3D形状生成技术为虚拟现实、3D打印和动画设计等领域提供了极具潜力的自然语言交互方式。然而，由于文本与3D形状在模态上的显著差异，以及高质量3D形状生成中存在的语义一致性和多样性挑战，目前的方法往往难以在生成质量与文本一致性之间取得平衡。提出了一种基于CLIP和动态语义优化的文本到3D形状生成方法。该方法通过构建动态语义优化模块，实时分解并调整文本特征的语义权重，使生成的3D形状更符合输入文本的描述。将动态语义优化嵌入现有的两阶段特征空间对齐框架中，显著提升了文本到3D形状生成的精度和质量。实验结果表明，与现有方法相比，该方法在生成质量、一致性方面得到了提升。