VLM011 高质量图像数据、文本数据的构建、训练前预处理策略