基于《通用规范汉字表》附件1《规范字与繁体字、异体字对照表》

文档繁简转换
《通规》
而不是按Word来

一款面向编辑出版、字幕与电子书制作场景的本地化繁简转换工具。
字形标准、保留原格式、按字转换、可校对——把Word繁简转换的“水土不服”一次解决。

输入 · 港台 / 旧字形 梁啟超 分別 山脈
內容 說明 記錄 關係戶
橫排 遙望 禹王宮
输出 · 《通规》规范繁体 梁啓超 分别 山脉
内容 説明 記録 關係户
横排 遥望 禹王宫
Win10 / Win11 · Ubuntu / Linux Mint Apache License 2.0
为什么需要

Word的繁简转换,
并不“标准”

市面上的转换工具,要么字形标准混乱,要么格式保留不到位。本工具存在的全部理由,就是把这两件事一起做对。

01 / 字形

Word杂糅非标准港台字形

Word自带繁简转换并不严格依据《通用规范汉字表》附件1,转换结果常混入港台地区的非标准字形,出版场景下不可用。

02 / 分词

按词转换易造成新错误

多数转换工具按词转换,缺乏分词处理能力,产生大量“看似对、实际错”的结果,审校成本反而更高。

03 / 格式

第三方工具丢失Word文档排版

不少繁简转换工具在处理Word文档时会改变原始格式——字体、样式、表格、图片都可能走样,等于二次返工。

核心特性

为编辑出版场景设计

每一项特性都对应一个真实的痛点——不做花活,只解决转换这件事。

严格遵循《通用规范汉字表》

转换字表与词典严格依据 2013 年国务院颁布的《通用规范汉字表》附件1,这是内地繁体出版的法定标准之一,出版机构可直接采用。

Word原生保留排版

Word文档(DOC/DOCX)转换后,字体、样式、表格、图片等原有格式完整保留,效果与Word内置的繁简转换一致。配合Word的“比较”功能可自动标出所有变动,便于审校。

基于OpenCC转换引擎

采用业界成熟的OpenCC库作为底层转换引擎,叠加基于《通用规范汉字表》附件1调整的异体字映射,转换结果较市面上主流工具可靠。

转换前分词提高正确率

集成结巴分词(现代汉语 + 古汉语),针对一对多转换设计词组转换逻辑,大幅提升准确率。

四种转换模式

总有一种适合你的稿件

简 → 繁

简体转《通规》繁体

把简体稿件转换为符合《通用规范汉字表》的规范繁体字形。

繁 → 简

《通规》繁体转简体

把《通规》规范繁体稿件还原为简体,字形准确、不丢格式。

港/台 → 陆

港台繁转《通规》繁

将港台标准或旧字形混杂的“繁体”,统一为《通规》规范繁体。

旧 → 新

旧字形转新字形

仅按《新华字典》等辞书的新旧字形对照表,转换字形而不动正—异关系。

支持的文件类型

覆盖主流文档与媒体格式

DOCX Word 文档
DOC Word 97-2003
TXT 纯文本
EPUB 电子书
SRT/ASS 字幕文件
可选增强功能

对症下药的进阶选项

针对转换中的疑难问题,提供可选的增强开关,默认关闭,需要时一键启用。

增强功能 ①

转换前分词

开启后,程序先对待转换文本做分词处理,显著提升转换准确率。分词增强完成后,文件仍维持原格式不变。

  • 现代汉语 + 古汉语 双模式支持
  • 分词结果不修改原文件,只用于转换决策
  • 尤其适合长篇Word稿件与电子书
增强功能 ②

TXT 编码指定

针对非 UTF-8 编码的TXT文件,允许用户指定一种编码进行解码,避免转换后出现乱码。

  • 支持 GBK/GB18030/Big5/UTF-8 等
  • 解码后正常进入转换流程,结果统一为 UTF-8
  • 对历史存档的字幕、TXT资料尤其有用
平台支持

Windows 与 Linux 双端覆盖

提供开箱即用的安装包,无需自行配置Python环境。

Windows

提供编译好的安装包,支持 Windows 10 / Windows 11,同时为 Windows 7 用户提供独立编译版本。下载后双击安装即可使用。

EXE 安装包Win10/11 & Win7 双版本原生 DOC 支持

Ubuntu / Linux Mint

提供 deb 格式安装包,主流 Linux 桌面发行版可直接安装。Linux 版当前支持 DOCX、TXT、EPUB与字幕文件。

DEB 安装包DOCX/TXT/EPUB/字幕Ubuntu/Linux Mint桌面
立即下载

挑一个适合你的版本,
马上开始转换

推荐直接下载安装包,免配置、免折腾;喜欢折腾的也可以从源码自行部署。

国内下载加速镜像: Gitee · GitCode · 查看源码 · Apache 2.0 许可 v1.3.8 · 基于 OpenCC 开源项目