Java处理markdown格式内容转换为word文档

最近有个需求，就是需要在项目中，初始添加的信息后，将详情页面导出为word文档，下载下来可以继续编辑。一开始考虑word的样式，字体等问题，使用开源的Apache POI，在保存为word内容时候，样式基本上会丢失，导致导出后的文档样式和在页面上看的不太一样，会出现错位等情况，希望使用商业版的word处理工具，比如Aspose Words或者Spire.Doc for Java（Spire.Doc for Java 中文教程）非常专业，功能非常强大。但是付费商业方案被否了，后来推荐直接导出为PDF格式，这样后端基本上也不用处理，导出PDF后，使用Adobe Acrobat在转换成Word即可，最后给了一个方案就是页面保存为markdown格式内容到数据库，然后下载时候，后端将markdown转换为word即可。

首先添加java处理的相关依赖：


 <!-- excel工具 ruoyi项目自身的依赖-->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.1.2</version>
        </dependency>
        
          <!-- 新添加的依赖-->
         <!--  markdown格式转换为html      -->
        <dependency>
            <groupId>org.commonmark</groupId>
            <artifactId>commonmark</artifactId>
            <version>0.21.0</version>
        </dependency>
 
<!--        poi-tl和poi-tl-plugin-markdown是处理markdown格式转换为word格式，处理只处理markdown转换为html,只需要commonnark依赖即可-->
        <dependency>
            <groupId>com.deepoove</groupId>
            <artifactId>poi-tl</artifactId>
            <version>1.10.1</version>
        </dependency>
 
        <dependency>
            <groupId>com.deepoove</groupId>
            <artifactId>poi-tl-plugin-markdown</artifactId>
            <version>1.0.3</version>
        </dependency>

编写工具类


package com.ruoyi.common.utils;
 
import com.deepoove.poi.XWPFTemplate;
import com.deepoove.poi.config.Configure;
import com.deepoove.poi.plugin.markdown.MarkdownRenderData;
import com.deepoove.poi.plugin.markdown.MarkdownRenderPolicy;
import com.deepoove.poi.plugin.markdown.MarkdownStyle;
import lombok.experimental.UtilityClass;
import lombok.extern.slf4j.Slf4j;
import org.commonmark.node.Node;
import org.commonmark.parser.Parser;
import org.commonmark.renderer.html.HtmlRenderer;
 
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;
import java.net.URLEncoder;
import java.util.HashMap;
import java.util.Map;
 
/**
 * @author xiaomifeng1010
 * @version 1.0
 * @date: 2024-08-24 17:23
 * @Description
 */
@UtilityClass
@Slf4j
public class MarkdownUtil {
 
 
    /**
     * markdown转html
     * @param markdownContent
     * @return
     */
    public String markdownToHtml(String markdownContent){
        Parser parser = Parser.builder().build();
        Node document = parser.parse(markdownContent);
        HtmlRenderer renderer = HtmlRenderer.builder().build();
        String htmlContent = renderer.render(document);
        log.info(htmlContent);
        return htmlContent;
    }
 
 
    /**
     * 将markdown格式内容转换为word并保存在本地
     * @param markdownContent
     * @param outputFileName
     */
    public void toDoc(String markdownContent,String outputFileName){
        log.info("markdownContent:{}",markdownContent);
        MarkdownRenderData code = new MarkdownRenderData();
        code.setMarkdown(markdownContent);
        MarkdownStyle style = MarkdownStyle.newStyle();
        style.setShowHeaderNumber(true);
        code.setStyle(style);
//      markdown样式处理与word模板中的标签{{md}}绑定
        Map<String, Object> data = new HashMap<>();
        data.put("md", code);
 
        Configure config = Configure.builder().bind("md", new MarkdownRenderPolicy()).build();
        try {
            //获取classpath
            String path = MarkdownUtil.class.getClassLoader().getResource("").getPath();
            log.info("classpath:{}", path);
            XWPFTemplate.compile(path + "markdown" + File.separator + "markdown_template.docx", config)
                    .render(data)
                    .writeToFile(path+"out_markdown_" + outputFileName + ".docx");
        } catch (IOException e) {
            log.error("保存为word出错");
        }
 
    }
 
    /**
     * 将markdown转换为word文档并下载
     * @param markdownContent
     * @param response
     * @param fileName
     */
    public void convertAndDownloadWordDocument(String markdownContent, HttpServletResponse response,String fileName) {
        log.info("markdownContent:{}",markdownContent);
        MarkdownRenderData code = new MarkdownRenderData();
        code.setMarkdown(markdownContent);
        MarkdownStyle style = MarkdownStyle.newStyle();
        style.setShowHeaderNumber(true);
        code.setStyle(style);
//      markdown样式处理与word模板中的标签{{md}}绑定
        Map<String, Object> data = new HashMap<>();
        data.put("md", code);
        Configure config = Configure.builder().bind("md", new MarkdownRenderPolicy()).build();
 
   try {
 
            //获取classpath
            String path = MarkdownUtil.class.getClassLoader().getResource("").getPath();
            log.info("classpath:{}", path);
            XWPFTemplate template = XWPFTemplate.compile(path + "markdown" + File.separator + "markdown_template.docx", config)
                    .render(data);
            template.writeAndClose(response.getOutputStream());
            response.setHeader("Content-Disposition", "attachment; filename=" + URLEncoder.encode(fileName, "UTF-8")+".docx");
            response.setContentType("application/vnd.openxmlformats-officedocument.wordprocessingml.document;charset=utf-8");
        } catch (IOException e) {
            log.error("下载word文档失败:{}", e.getMessage());
        }
    }
 
 
public static void main(String[] args) {
        String markdownContent = "# 一级标题
" +
                "## 二级标题
" +
                "### 三级标题
" +
                "#### 四级标题
" +
                "##### 五级标题
" +
                "###### 六级标题
" +
                "## 段落
" +
                "这是一段普通的段落。
" +
                "## 列表
" +
                "### 无序列表
" +
                "- 项目1
" +
                "- 项目2
" +
                "- 项目3
" +
                "### 有序列表
" +
                "1. 项目1
" +
                "2. 项目2
" +
                "3. 项目3
" +
                "## 链接
" +
                "[百度](https://www.baidu.com)
" +
                "## 图片
" +
                "![图片描述](https://www.baidu.com/img/bd_logo1.png)
" +
                "## 表格
" +
                "| 表头1 | 表头2 | 表头3 |
" +
                "|-------|-------|-------|
" +
                "| 单元格1 | 单元格2 | 单元格3 |
" +
                "| 单元格4 | 单元格5 | 单元格6 |";
        toDoc(markdownContent, "test23");
 
 
}
}

这个代码是初步版本，导出的文档直接保存在了本地，初步测试成功。如果运行main方法测试报错，比如这样：

Java处理markdown格式内容转换为word文档

提示找不到xx方法，是因为新添加的poi-tl依赖的版本问题，因为项目是使用的ruoyi脚手架的版本比较古老，项目本身依赖的poi版本比较旧是4.X版本，所以将poi-tl版本降低一点就行了，比如使用1.10.1版本，然后再次运行就成功了

Java处理markdown格式内容转换为word文档

转换markdown到word过程中，首先需要一个word模板，实际上还是用markdown内容经过markdown渲染器渲染后的内容去填充word模版中的占位符{{md}}

word模版可以从poi-tl项目的官方github仓库下载：
https://github.com/Sayi/poi-tl/tree/master/poi-tl-plugin-markdown/src/test/resources

Java处理markdown格式内容转换为word文档

将这个markdown文件夹放在本项目的resources目录下就可以了

Java处理markdown格式内容转换为word文档

里边有5个文件，其中4个md文件主要是为了测试使用的,word文件是用于渲染的模版

内容是这样的：

Java处理markdown格式内容转换为word文档

然后执行刚才工具类中main方法成功后，在项目target下就会生成一个新的渲染markdown内容填充后的word文档

Java处理markdown格式内容转换为word文档

内容为这样：

Java处理markdown格式内容转换为word文档

生成的效果还不错。

如果你直接用md文件测试，而不是使用一段md格式的字符串，测试方法可以参考官方的测试方法：

Java处理markdown格式内容转换为word文档


package com.deepoove.poi.plugin.markdown;
 
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.HashMap;
import java.util.Map;
 
import com.deepoove.poi.XWPFTemplate;
import com.deepoove.poi.config.Configure;
 
public class MarkdownTest {
 
    public static void testMarkdown(String name) throws Exception {
        MarkdownRenderData code = new MarkdownRenderData();
        byte[] bytes = Files.readAllBytes(Paths.get("src/test/resources/markdown/" + name + ".md"));
        String mkdn = new String(bytes);
        code.setMarkdown(mkdn);
 
        MarkdownStyle style = MarkdownStyle.newStyle();
        style.setShowHeaderNumber(true);
        code.setStyle(style);
 
        Map<String, Object> data = new HashMap<>();
        data.put("md", code);
 
        Configure config = Configure.builder().bind("md", new MarkdownRenderPolicy()).build();
        XWPFTemplate.compile("src/test/resources/markdown/markdown_template.docx", config)
                .render(data)
                .writeToFile("target/out_markdown_" + name + ".docx");
    }
 
    public static void main(String[] args) throws Exception {
        testMarkdown("api");
        testMarkdown("func");
        testMarkdown("README");
    }
 
}