市面上的转换工具,要么字形标准混乱,要么格式保留不到位。本工具存在的全部理由,就是把这两件事一起做对。
Word自带繁简转换并不严格依据《通用规范汉字表》附件1,转换结果常混入港台地区的非标准字形,出版场景下不可用。
多数转换工具按词转换,缺乏分词处理能力,产生大量“看似对、实际错”的结果,审校成本反而更高。
不少繁简转换工具在处理Word文档时会改变原始格式——字体、样式、表格、图片都可能走样,等于二次返工。
每一项特性都对应一个真实的痛点——不做花活,只解决转换这件事。
转换字表与词典严格依据 2013 年国务院颁布的《通用规范汉字表》附件1,这是内地繁体出版的法定标准之一,出版机构可直接采用。
Word文档(DOC/DOCX)转换后,字体、样式、表格、图片等原有格式完整保留,效果与Word内置的繁简转换一致。配合Word的“比较”功能可自动标出所有变动,便于审校。
采用业界成熟的OpenCC库作为底层转换引擎,叠加基于《通用规范汉字表》附件1调整的异体字映射,转换结果较市面上主流工具可靠。
集成结巴分词(现代汉语 + 古汉语),针对一对多转换设计词组转换逻辑,大幅提升准确率。
把简体稿件转换为符合《通用规范汉字表》的规范繁体字形。
把《通规》规范繁体稿件还原为简体,字形准确、不丢格式。
将港台标准或旧字形混杂的“繁体”,统一为《通规》规范繁体。
仅按《新华字典》等辞书的新旧字形对照表,转换字形而不动正—异关系。
针对转换中的疑难问题,提供可选的增强开关,默认关闭,需要时一键启用。
开启后,程序先对待转换文本做分词处理,显著提升转换准确率。分词增强完成后,文件仍维持原格式不变。
针对非 UTF-8 编码的TXT文件,允许用户指定一种编码进行解码,避免转换后出现乱码。
提供开箱即用的安装包,无需自行配置Python环境。
提供编译好的安装包,支持 Windows 10 / Windows 11,同时为 Windows 7 用户提供独立编译版本。下载后双击安装即可使用。
提供 deb 格式安装包,主流 Linux 桌面发行版可直接安装。Linux 版当前支持 DOCX、TXT、EPUB与字幕文件。
推荐直接下载安装包,免配置、免折腾;喜欢折腾的也可以从源码自行部署。