pdf转ofd字符变形问题的解决

镜像文字

nealian 2021-03-15 PM 1541℃ 0条

问题描述

利用开源代码将pdf转换为ofd后，字符发生变形，显示为一个竖条。

解决过程

查看生成的ofd文件，发现每个textobject多了hscale这一属性，在代码中查找hscale，发现了这段代码

if (nextTextRenderingMatrix.getScaleX() != nextTextRenderingMatrix.getScaleY()) {
    $textObj.setHScale(
        (double) nextTextRenderingMatrix.getScaleX() );
}

简单地把这段代码注释掉，发现生成的ofd文件中文字之间相互有沾粘，同时在wps中打开原doc文件，将文字与正常的相同字体的文字对比，发现文字确实存在横向压缩。因此结论是这段代码设置的HScale不正确，需要修改为正确的计算方式。

再看这段代码，在scaleX和scaleY不相等时才设置横向压缩，猜想：scaleX和scaleY相等说明这个字X和Y方向压缩比相同，因此字形与原字形相同，只是整体字号进行了缩放，不相同时说明存在字形上的压缩，而HScale表示的是横向的压缩，因此应该为 scaleX 与scaleY的比值，修改代码如下：

if (nextTextRenderingMatrix.getScaleX() != nextTextRenderingMatrix.getScaleY()) {
    $textObj.setHScale(
        (double) nextTextRenderingMatrix.getScaleX() / (double) nextTextRenderingMatrix.getScaleY());
}

经测试，结果字形缩放正确。

延伸

ofd标准中textobject只有hscale属性，没有vscale，那如何表示纵向压缩
猜想：若hscale大于1则表示纵向压缩
验证：将hscale设置为大于1的值，如2,发现文字字形确实纵向压缩
结论：一般而言，通过scaleX和scaleY就能确定这个字的字形，但是ofd标准中应该是使用了scaleY先确定了字形的高（此时字形的宽进行等比压缩），再通过hscale值横向压缩确定字形的宽，其中hscale=scaleX/scaleY

总结

第一步仍然是对比，发现问题样本与正常样本的区别
然后是找到产生差异的地方，利用相关知识和经验，分析问题
再然后是进行「猜想-验证」循环
解决问题后可以进一步思考，以验证解决方案是否考虑全面，是否从根源上得到解决

标签: none

非特殊说明，本博所有文章均为博主原创。

如若转载，请注明出处：http://www.nealian.cn/index.php/2021/03/15/pdfzhuan-ofdzi-fu-bian-xing-wen-ti-de-jie-jue.html

上一篇包面

下一篇关于注意力

评论啦~

分析问题时，不论中间有多少层原因，最终一定得归因到自己，这样才能解决问题，从而取得进步2021-06-27 14:29
坐在出租车后排，戴着耳机，当音乐响起的时候，道路、天桥、大楼、来往车辆与行人，构成一幅熟悉的画面。仿佛置身于影视剧中，恰巧旁白平稳而有力地说道：“他觉得自己就像是电视剧中的主人公，他所想的正是编剧所想的，他所见的正是观众所见的，而此刻，他既是编剧，又是这观众。”2021-06-15 05:05
内心的宁静就是幸福。2020-12-25 15:32
要给自己的创造性和深刻性以成长和发挥空间，或是在兴趣或是在工作！2020-08-30 05:32
拉格朗日：“我工作纯属是为了消遣”2020-08-30 05:31
做有创造性的工作。如果某项工作内容本身不具有创造性，那就应该改变工作方式，发掘其可创造的地方。2020-08-29 15:08
做一个慷慨学家。2020-04-20 03:17
我相信，生命就是用来享受的，自己感到快乐就是最重要的事情。 —— 蒂莫西●费里斯，《每周工作四小时》作者2019-12-18 04:51

友谊 vscode Mybase7 方法注意力对话

pdf转ofd字符变形问题的解决

问题描述

解决过程

延伸

总结

评论啦~

栏目分类

博主动态 ~

标签云

友情链接

pdf转ofd字符变形问题的解决

问题描述

解决过程

延伸

总结

 评论啦~

 栏目分类

博主动态 ~

标签云

友情链接

评论啦~

栏目分类

博主动态 ~

标签云

友情链接