基于大语言模型、视觉基础模型等大模型进行三维视觉、决策智能等方向的研究