回答-BFW问答

大模型能让所有可视化的东西通过图片转换成markdown格式，即时里面有图片，大模型也能识别理解生成描述，所以只要把ppt、pdf、excel、word等任意文档先转成图片，然后让大模型来识别理解生成markdown格式的文本。

市面上基于ocr识别的markdown文本无法理解图片的。