一文多发助手MVP实践

产品名称：一文多发助手 · MVP实践报告

一、文档信息

版本：v0.1 MVP
状态：已验证跑通（个人博客、微信公众号）
撰写人：邹阳
日期：2026-04-23

二、背景与痛点分析

用户场景：OneNote个人知识库维护习惯，写长文包含截图/手写笔记

核心痛点：

图片迁移麻烦：OneNode复制粘贴时图片变成Base64或丢失，手动上传图床繁琐
格式适配繁琐：博客要Front-matter，公众号要特殊排版，小红书要短文案
发布流程割裂：多平台切换导致重复劳动，时间浪费在复制粘贴上

三、竞品分析

竞品：WechatSync（开源多平台同步助手）

💡 详细报告请跳转一文多发产品调研

差异化优势对比：

输入源：竞品依赖自有MD编辑器；本方兼容OneNote导出的Word，维护知识库完整性
智能处理：竞品无智能排版；本方含内容重排、100字摘要提炼、标签生成
基础设施：竞品图片分散；本方统一阿里云OSS图床

四、MVP范围定义

版本目标：验证"OneNote"导入→AI增强→自动推送博客/公众号的核心闭环。

✅ In Scope (v0.1 已实现)：

输入：OneNote 导出 Word 文档（纯图文）
处理：图片提取并上传 OSS、格式转为 Markdown、AI 内容重排与摘要
输出：
- 自动化：GitHub 个人博客 Hexo 架构自动推送（含 Front-matter）
- 半自动：生成微信公众号适配内容（借助本地 wenyan-cli 手动粘贴）

❌ Out of Scope (暂未实现/下一版本)：

小红书、知乎、掘金的自动草稿箱功能
数学公式 OCR 精准转换
飞书/语雀等云端文档直连

五、核心功能说明

流程总览图

最外层上下文视图

Agent系统内部图

Agent工作流总览图

文件解析

内容增强

图片上传

格式适配

多渠道发布

核心处理流程

1. 输入

来源：OneNote导出的Word文件（.docx)
承载平台：Coze Agent

2. 文件解析

执行方式：调用工作流 document_parse_flow
核心工具：TextIn（第三方文档解析 API）
处理动作：提取文字、图片，生成初始markdown内容

⚠️ 已知问题：TextIn 的 OCR 会生成无意义图片（如装饰元素、公式碎片等）

3. 内容增强

执行方式：调用工作流 content_enhancement_flow
处理动作：
- 文章重新排版
- 生成约 100 字内容摘要
- 自动生成封面图

4. 人工审核阶段

目的：弥补 TextIn 解析的 OCR 缺陷
审核内容：
- 删除无意义图片
- 修正错误文本
- 确认文章结构与标题
输出产物：经过校验的标准中转 Markdown 文件

5. 图片处理阶段

执行方式：调用自定义插件 AliyunOSSUpload
处理动作：
- 将 Markdown 中的本地图片上传至阿里云 OSS 图床
- 自动替换文中图片链接为外链 URL

6. 发布分发阶段

目标平台	执行方式	具体操作
个人博客	自动	调用 `github_push_flow` 工作流，生成含 Front-matter 的 Markdown 文件，自动推送至 GitHub（Hexo 架构）
微信公众号	半自动	复制适配后的 Markdown 内容，通过本地安装的 `wenyan-cli` 工具完成格式转换与发布

六、MVP产品方案与技术选型

技术选型与决策

看了模型架构后会更加详细的添加内容

编排平台：

Coze平台：Workflow+插件

文档解析：

Textin API，对比Coze内置LinkReaderPlugin插件会丢失超链接/图片，故自建代码节点调用

图床服务：

AliyunOSS（自定义Coze插件接入）

推理模型：

DeepSeek v3.2：后续插入详细模型分析

发布工具：

博客走Github API工作流
公众号走Wenyan-cli（放弃md2wechat，付费），放弃Wenyan-MCP版本，目前Coze不支持

关键问题与解决方案

1. 图片被模型误删

现象：Kimi 128k在编排节点自行删除了图片连接
解决：切换DeepSeek v3.2 + 强制约束Prompt（明确指出：禁止OCR，禁止删除任何![]…链接）

2. Coze代码节点沙箱限制

现象：无法安装python-docx
解决：改用HTTP节点调用第三方TextIn文旦解析API（需付费）

3. 本地CLI工具安装污染

现象：where md2chat发现旧版本残留导致冲突
解决：清理注册表/Path，切换至wenyan-cli方案

七、核心指标与验证结果

定性结果

✅ 成功推送一篇产品经理基础课长文到Hexo博客（带自动生成的封面摘要）
✅ 成功生成微信公众号版本，通过本地工具一键注入微信公众后台直接发布
❌ 文章AI基础知识（含大量公式截图和手写内容），准确率低，被标记为下一迭代已知限制

八、后续迭代方向与发展规划

阶段二 (v0.2)：

公式处理专项：引入 MathPix 节点专门处理 OneNote 公式截图 → LaTeX 转换
平台扩展：补全掘金、知乎、小红书的格式适配逻辑（纯 Prompt 工作流即可覆盖）
架构迁移调研：从 Coze → OpenClaw / Claude Code 迁移

💡 判断依据：Coze 对 Skills/MCP 支持有限，且在代码节点依赖上受限，Claude Code 对于文件操作和本地环境调用更灵活直接，适合"一文多发"这类强依赖文件 IO 的任务。

九、总结与反思

OneNote→Word→TextIn OCR链路增加文章解析这不稳定的一步，OCR易识别出图片中的无意义文字和装饰图标等，导致增加人工审核步骤，这个问题来源于内容输入源。

需要清楚知识型技术博主的知识存储方式是什么。

市场上知识型创作者的记录方式分层：

本地markdown：Obsidian/typora/VS code+图床
在线markdown：语雀/飞书/Notion
富文本笔记：OneNote/印象（使用是因为图片增删改查非常方便）
纯在线写作：公众号后台/第三方编辑器

v2.0迭代：

输入源适配（不同格式走不同处理通道，避免OCR滥用）：

保留word输入源
增加pdf输入源
增加markdown文件直接上传（覆盖Obsidian/Typora用户）
增加飞书/语雀API读取（覆盖在线文档用户）

不支持在线编辑，主要功能是内容分发等