Pdf古书竖版繁体文字提取软件求助 欢迎转发
图1: 请问大家这种竖版的繁体有没有推荐的软件提取文字?最好一次性能提取完一本书
图2: 这种Pdf放大也看不清的书法章节有可以专门提取文字的软件吗?
古书最终目的是翻译成英文,所以如果有一次性提取转简体的更好。
图1现状:直接Pdf版本复制粘贴原文字,但问题是需要花很多时间对照原文粘贴后的错字。可能是有的古字词和字比较老系统无法识别,如回,本书写于民国时期用的囘,需上网查确定字义,所以复制后原文的囘变成了回,难保证百分百还原原文及无字义的差异。
用了微信的文字提取功能,是可以保证100%内容准确性,但是需要截图为图片格式,一页页来,一共几百页,效率较低。
不知有无考古系、汉学等领域的大佬、同学们能赐教?不胜感激(我最近看多了都有点习惯文言文了)
#古书 #文字提取 #书籍 #文字识别 #文字提取软件 #繁体 #竖版繁体 #繁体竖版书 #考古软件 #汉学 #考古系 #中文系 #古代文学 #繁体字识别 #中翻英 #繁体书籍