喜欢阅读电子书的朋友,特别是拥有Kindle等电纸书的朋友谈到扫描PDF(Scanned PDF),大多是又爱又恨,”爱”在大量书籍、尤其是发行较早或外文原版的一些经典书籍,多由热心人士私下扫描成PDF发布在网络上,可以方便地下载到硬盘里(摆在那儿心里就踏实,看不看就另说了);”恨”在扫描PDF(Scanned PDF)”骨头”太硬,不能像原生PDF(Native PDF)那样转换成各种格式。小小6寸屏,甚至3、4寸屏,纵然有满腔阅读热情,眼睛挤着挤着就吃不消了。由Willus开发的免费PDF处理软件K2PDFopt很好地解决了这个问题,可以让大家硬盘里堆积如山的扫描PDF真正重见天日。
K2PDFopt 优化效果图(更多对比图请参看作者主页)
源文件版面(A4)
转化为 ↓↓↓ 转化为 ↓↓↓
优化版面(6寸)
K2PDFopt 特点
K2PDFopt能够为屏幕尺寸较小的(如4寸、6寸)的移动阅读器(如Kindle)和智能手机优化PDF/DJVU文件,使之易于阅读,它对两栏或多栏的PDF/DJVU(如科技期刊杂志)处理表现尤佳。
K2PDFopt的基本原理是将PDF/DJVU文件的每一页转化成图片格式,然后经扫描将这幅图片内的文字图标划分成一个个矩形区域,最后进行重新布局制成设定的尺寸较小的多页PDF,从而达到使文字图表放大、易于阅读的目的。
K2PDFopt是一个单独的Dos界面的控制台程序,小巧绿色,提供Windows(32/64位)、Mac、Linux版本,支持批量处理,并且在不断更新,据作者主页显示,最近一次更新是在2012.04.05。这里是作者英文主页的各版本下载地址,若下载不便,这里是网盘地址(win32)。Mac的介绍请见Darren的对应博文。
开始使用K2PDFopt
别被Dos界面和一堆英文”小蝌蚪”吓倒,K2PDFopt是很容易上手的,在大多数时候,一次操作足矣。
1. 将一个文件或文件夹拖至K2图标,弹出交互界面;
2. 在光标闪烁处根据需要输入一个上方命令栏每行开头的字母,如我要设置转换后文字图表的排列形式(靠右对齐、居中还是靠左对齐?),那么输入命令j(左侧倒数第二个字母),回车(Enter)执行;又出现一行,再次在光标闪烁处输入二次命令:l(Left,靠左)或c(Center,居中)或r(Right, 靠右),回车执行。若还要执行其它命令,重复上述操作,一次实现一项功能,没有输入的命令按默认(实际使用中,改动很少,默认处理已很赞)。最后,按一下回车,出现处理过程界面(1 page(页),2 page(页), …),处理速度很快,处理好的文件与源文件在同一目录下,并在源文件名后加上”_opt”(optimize,优化)作为新命名。好了,赶快打开文件试试吧!
K2PDFopt命令表(只有几项是关键的,其他默认已很赞)
后记
花了不少时间来使用k2pdfopt(处理竖版书很有挑战性)并编写了这份简单说明,因为这确实是一款令我兴奋的PDF优化软件。当然,这款软件还有不少值得改进的地方,我会尝试与软件作者交流,提出自己的建议。上述介绍也有很多疏漏或不准确的地方,希望大家看到后结合自己使用情况及时告诉我,教我些小窍门。我自己用的是Kindle3,软件作者Willus用的是Kindle2,不同阅读器可能会有差异,大家多交流。另外,Willus还就一些常见问题进行了说明,提供了不少技巧,我是摸索了一阵才去看的,看了之后用起来更得心应手了,我会把这些技巧陆续分享(K2PDFopt使用常见问题)出来,也欢迎大家分享自己的技巧。
转载请注明出处:铄日博客
本文链接: http://note1day.com/2011/12/k2pdfopt/






非常不错的软件,看介绍很强大。但是还不会用呢–把文件拉过去后,按ENTER,无反应。
您好,可能原因:软件作者Willus在11月11号(神棍节啊^_^)发布的1.33版(也就是他推荐下载的最新版)加入了自动检测源文件页面方向的功能,如果是页面是躺着放的,软件会旋转页面使之竖起来,您说没反应,可能就是源文件页面类型复杂,检测时间过长,可输入命令:先rt(旋转命令)再n(取消转正)然后一直Enter就会出现处理过程了。或者用之前的版本试试,我这里还有个1.23版的,金山快盘下载:文件名:k2pdfopt_v1.23.rar,访问地址:http://www.kuaipan.cn/index.php?ac=file&oid=34089829738217474
K2PDFopt用来处理扫描版的文件,我个人认为,目前是最适合的。因为程序使用的是图像识别算法。所以,如果需要重新排版的话(例如在对付扫描版文件)这个方法是无敌的,:)
不过不足也是比较明显的:
一个是处理后的效果取决于算法的好坏,具有不确定性(例如:如果公式,符号,框图什么的比较复杂,可能会悲剧);第二个就是执行速度, PDF->图片->PDF的过程,相对打开一个PDF文件来说,是很漫长的。
但是,这样的tradeoff也是必须的,呵呵。毕竟这个功能是从无到有,不能吹毛求疵。
如果是普通的PDF文件,如果不需要重新排版,直接切就好了,会快很多。
感谢指点,您比我更了解这款软件,句句切中要害,希望看到这条评论的朋友对这款软件有更清晰的认识。说实话,发现这款软件后,我异常惊喜,准备用它“包打天下”,但随着使用的深入,不足就慢慢暴露出来,正如您所言,“不确定性”和“处理速度”是硬伤,不过对于大量阅读论文的朋友来说已是大大的好工具了。您的paper4Kindle我还没有深入使用,我想在使用后也写篇介绍推荐给我的朋友们,希望您同意。
欢迎,呵呵。
博主很强大,我支持
页面全是英语,是推荐健身仪器的,应该是机器人发的吧,不过“千穿万穿,马屁不穿”,我郑重地感谢你的支持。呵呵!
哎,发觉非常有必要重新梳理下 对kindle可用的pdf裁边软件。
北邮博士做的那个软件发觉试验失败。。悲剧。。
那个bug是windows下中文编码的问题。文件夹路径中不要用中文就好了。(例如,那个例子中的那堆乱码就是”桌面“这两个字)
为了保持各个操作系统上软件的一致性,我没有单独对windows平台的软件做修改,而是希望找到一个统一的方法。
并且这个问题只有在编译之后才会有, 即便在windows环境下调试,也不会出现这个Bug,所以比较麻烦。
这个软件反应还是可以的,可以参考这里
http://www.hi-pda.com/forum/viewthread.php?tid=859426
您好,看到您用k2pdfopt处理竖排的扫描书籍效果很不错,可以介绍一下方法吗?
您好,感谢留言,正在整理,稍后总结至博客。以前由于没有使用k2pdfopt的“命令行”功能,所以是用pdfsam(一个很好用的开源pdf分割合并软件)先将文件向左旋转90°,再用k2pdfopt处理,现在发现“命令行”可以一步到位(速度可能逊色些),所以正在尝试。
可以考虑试试我写的软件:Paper 4 kindle,旋转切边分页可以一次完成。
Shawn哥,他要处理竖排板式的,得一列一列切,一列一列重排,实在纠结,你有什么好主意没,我没辙了。⊙﹏⊙b
彻底凌乱了!!!今天昨天折腾了5个多小时,还是搞不明白,这竖排版面实在折磨人,多次实验均已失败告终,抱歉暂时无法给出明确解答,失败总结:1. 切白边,旋转最好提前解决,只让k2pdfopt做页面图像识别分割重排就好,速度快些,不容易出错;2. 这样处理竖版费力不讨好,页数少可以折腾下,页数多了还是歇歇吧,如偏爱竖版,如臺灣同胞,請轉至“好讀”網站,上面有很多精心排版的豎排書籍以及各個平臺的豎排閱讀軟體,地址:http://www.haodoo.net/
你可以考虑按照这个步骤来进行:
先用P4K处理:
1.切边
2.按照纵向的列将原文切成一列一页或者N列一页。
之后用k2pdfopt处理:
设定好新页面的页长和页宽,让k2pdfopt进行内容抓取和重排。
另:
PDF处理的工具很多,TeXLive里有一些,gs(ghost script)更强大。如果需要可以摸索一下。
好的,谢谢指导,我知道太有限了,边走边学。
想请教一下,我用K·PDFopt转的文件,为什么文字总是有大有小?导致的结果是,字大的那段话,为分成了两行,紧接着的那段文字字是小的,被子夹在了中间,觉得很凌乱。
晚上好, lanfmjs。我也在处理中遇到过类似问题,按着默认设置“一拖”来处理只适用于版面很整齐的页面。你可以尝试调整输出分别率来调整切割幅度,尽可能避免上述情况。博客中“k2pdfopt使用常见问题”一文有相关内容,或者不介意的话,把书发给你我,咱们一起处理,myfavblog@163.com
或者尝试下paper4kindle以及结合briss辅助处理。说实话,想做好一本满意的书不容易,我现在折腾得少多了。@_@
很不错的软件,终于能显示一些中文书了。不过有些大部头转化之后特别大,kindle已经不能识别了。是否有好的截取方式呀
^o^,有的确实太大,kindle无条件罢工。可以试试免费开源软件: PDFsam,先分成几个较小的文件,再转化。恩,记得它需要Java支持。
为什么我都失败了,直接拖进去生成的都打不开的
你好。是不是文件太大了,还没处理完你就强制停止了?或者是PDF格式的问题,能否发我一份源文件,如果方便的话,咱们一起看看。(^o^)
童鞋,你真是好童鞋。我看到你的回复,百忙之中穿越过来探望你。
1,你翻译的东东,我很感谢。
2,关于竖排的软件和版权问题,我的方法是:1,旋转Adobe Acrobat 9 Professional横转。2,使用(pdf_split_merge)将pdf文件分割为单个图片,3,用拖把更名器将文件顺序命名。4,用Pdg2Pic将图片目录整合为单个pdf文件。然后用k2pdfopt继续处理。附:如果是对开的扫描,1步后,用Adobe Acrobat 9 Professional将文件切割为单页,另存为。这样保存2个单页。然后进行2+3。最后4步前把2个文件的图片整理到一起。
问题是版权问题,我实在英文不行,能推荐下可以替换(我用过的这些软件的)免费开源软件吗?版权问题真是个问题,必须解决啊。求帮助。
你好,颠倒颠,谢谢你!真是神龙见首不见尾,你在豆瓣上抛出那篇介绍K2pdfopt的文章后就没再出现过,这篇豆贴帮助了很多kindle人,也促使我写了这篇翻译文章(命令行批处理那部分没做介绍,我不太懂)。
处理竖版书的方法我们几乎一样,只是我用PDFsam——也就是你提到的pdf spilit merge——解决分页旋转的,有点麻烦。后来有朋友问处理方法,我就尝试用K2pdfopt一步到位,它自带旋转功能,但试了一个晚上,效果还是很差,顺序倒置。最近没再尝试,推荐软件还是PDFsam,还有本土优秀产品paper4kindle。再次感谢你的认真精神!\^O^/
好童鞋,老天回鼓励你的勤奋精神的。看来暂时就只能这样了,反正我自己的需求全部满足了,其他人就让他们自己挣扎去吧。哇哈哈哈~~~
对了,我把你的这个网址链接,贴到我的帖子头部了。本来是特意过来告诉你的。结果现在才想起来这个正题。。。汗。。。。
实际上 ,我本人用的是nook2 simple touch。使用后感觉安卓平台,更舒服。很多软件。pdf也可以各种放大看。各种字典(qdict),使用ireader(可惜没找到优质的免费开源文档阅读器)可以阅读绝大多数文档。不能阅读的用pdfviewer。基本格式全覆盖了。
你们的kindle使用感觉怎么样?
评论这块我还不怎么会用,现在才看到你的评论,只在谈读书那片文章回复你了,不好意思。
Kindle Keyboard用着挺好,是我的第一款阅读器,没什么比较,很想试试nook2,手机目前是Android,FBreader、Aldiko Prenium等软件确实强大。看到论坛、豆瓣小组里kindle的声势明显强很多,主要是国人都还不熟悉Nook及提供其服务的BARNES & NOBLE公司,而亚马逊(卓越)已是无人不知的电商了。看老牛(折腾epub到令人敬佩)的文章,感觉kindle更适合不太喜欢折腾的朋友,当然,安了多看系统后就更安逸了,而nook更灵活,更便于个性化,有机会我也体验下。不管怎么说,让阅读触手可及,“读好书,多读书”是最终目的。^_^
你好,我想处理扫描版的PDF到KINDLE里面看,可是双栏的排版不知道该怎么弄呢。。。PAPER4KINDLE只会丢进去按默认处理,发现有些问题,又不知道该如何设置参数了,求助~
你好,小水。设置参数有两种方法:=”后面的串数字改成你想要显示的名字(中文编码不知道会不会有bug, 最好用拼音或者英文), 例如 example1
(1). 在程序界面的那一列空栏里填入相应参数,设置切上白边、下白边等的比例;
(2). 点击界面的“预设参数“按钮,进行更加个性化的设置,也方便批量处理(以后用到时,调入这个参数文件即可)。下面贴上关于参数的保存和使用:
1 运行程序, 调整好参数,
2 按”保存.cfg文件”, 这时会在程序的所在目录生成一个 “当前日期_时间_随机数.cfg”
3 用文本编辑器打开这个文件, 将其中”
4 文件另存为(注意大小写)Conf0.cfg, 或者Conf1.cfg, 或者Conf2.cfg, 例如我们改为Conf1.cfg
5 重新运行程序, 这时你会发现, 预设参数中的第二个按钮的名字已经变成你之前输入的”example1″, 点它, 就会调用你刚才输入的参数.
6 Conf0.cfg 对应最左边的按钮. Conf1.cfg对应第二个按钮, Conf2.cfg对应第三个按钮
7 删掉Confx.cfg (x=0,1或2), 程序就会使用IEEE论文的默认设置.
不知道是否有帮助,若还有问题可以直接问Shawn(点他的名字进入他的博客),楼下这个就是。你看,他的回复非常快,不过Shawn同学最近好像比较忙。
感谢,回复得好快哦,其实我是小白,想问下有没有通用的设置参数,来对付双栏的扫描图片,因为在KINDLE人论坛下载的漫画制作软件,很方便的只用选分割和顺序就OK了,所以想是不是PAPER4KINDLE软件也能这样处理呢。。。然后想问下预知参数的三个选项分别是用于功能呢?
汗,打快漏字了。是想问“预置参数有三种,分别用于什么功能呢?”
还有用K2PDFopt来处理我的问题是不是会更好些呢?
具体是什么问题呢?
我那个源文件是扫描版的双栏教参,然后我就直接丢软件里面处理了,参数不大懂,默认了第一个选项的,切边数值也是默认的,处理出来的文档可以看,其实很不错了,但有点小问题就是:1.一页被分成了“田”字的4块,还好是按排序出来的,可是我只想要把双栏切成单个看,不知道用处理漫画的法子可行不;2.有一些页面的最底下一行切割碎字了,还好下一页开头又有完整的一行,不影响观看,同理个别页面纵切的时候也是歪的。
预置参数应该是针对IEEE论文的三种板式,我没接触过IEEE论文,这得问博士哥Shawn,建议用briss或pdfscissors试试,有重叠预览功能,切起来很方便,想分成几块就几块。至于k2pdfopt,处理效果有的很不理想,而且速度比较慢,实在没辙了再试一下。
你贴的古籍跟我的版式差不多。竖版三十多字。求全面参数。
老闷,你好。抱歉,制作竖版是2个多月前的事了,各项参数都记不起来了,只能介绍下方法,希望有帮助。上次有朋友问,我下大力气尝试了直接用K2pdfopt旋转+重排,失败了,所以这里还是把笨方法抬出来,和本页评论中“颠倒颠”同学的方法差不多,只是所用软件有差异,可以看看。我的方法:
注意,请先拿几十页做实验,否则转换很慢,会让人抓狂的。T_T
1。旋转:用PDFsam(类似软件都行,只是它是免费开源的)将所有页面向左90°横转;
2。裁边:裁掉白边,Briss、PDFscissors等都可以,对开的扫描也需要预先对切一下;
3。K2处理:用k2pdfopt处理,耐心等待,为了较好的版面,请反复调整,这里请参考“k2PDFopt使用常见问题”一文中的“所截各行参差不齐”;
4。再旋转:将第一步的操作倒过来做一遍,大工告成。
Good Luck!
文件是27M,扫描版的,试了3次都是中途无故错误退出了,系统是WIN732位版本
你好,有朋友也留言说遇到过这种很让人郁闷的情况,可能是原始文件扫描质量比较差或文件太大,你有没有试试把文件分成几部分再处理?
没试过,不晓得怎么分?
我用的是软件PDFsam,中文译为PDF分割与合并,免费开源,可以Google一下,里面有相应的选项,很方便。如果不习惯,可以试试Foxit Phantom,功能强大但收费,不过有很多破解版本。
在软件的下载页面底下有写: If k2pdfopt is terminating abnormally (crashing) when you run it, try one of the “Older CPU” downloads below. They are a little slower than the downloads above, but are compiled for more generic i386 CPUs with less aggressive optimizations.
可以试试看换成旧CPU版本。
文科生表示什么的都不懂,好像很牛逼的样子哇。
能让我看上非扫描版的Guidebook就很满足了。
支持支持!
谢谢支持!说实话,k2pdfopt虽然牛但我还是觉得麻烦,技术达人们肯定喜欢。可怜咱们被图形界面(GUI)绑架多年,中毒太深了,第一次看到命令行界面,我直接崩溃而逃,后来在豆瓣上被颠倒颠同学刺激了,回来补了这篇文章,能大概看懂英语就可以折腾了。
如果有人写个GUI就更好了
就是就是。
Pingback 引用通告: K2PDFopt: convert scanning pdf/djvu file to kindle-friendly format | OMY
这个软件太酷了,转了一个480页的扫描版pdf,什么参数都没改,用了半个小时,试看一下,效果还不错。关键还支持linux,安装很方便啊。在作者Willus的页面上还发现其它几个有意思的软件。
恩,我第一次用时也高兴坏了,他的页面上还有很多免费的优秀软件。Willus是个大个人啊。
深作了,非常好用。
谢谢来访。^o^
非常地好用,谢谢!
能做个GUI吗?
用开源支持命令行的图像处理软件+这个软件+人工
操作时候,首先软件自动红线框住操作区域,然后可以手工画框标序号纠正错误,然后开始处理图书。人工校对红线框时,支持快捷键翻页等功能。
好像不是很麻烦的样子啊,就是个大杂烩,楼主你来试试不?
好久不见,颠倒颠!我的水平也就看看英文技术文档,编程什么的还在幼儿园,很遗憾,不过在加紧学习。你说的这个大杂烩软件还真有,叫Papercrop,应该可以实现你说的大多数功能,你搜下试试。我用过,用Lua写的,不太稳定,我用的不顺手,就没再深入。
Pingback 引用通告: 用Paper4kindle将PDF切割重排至6寸 | 铄日博客
这个软件貌似强大,但对于50M的pdf,还是扫描好的文件就不行了。就是文件稍微大些,这个软件就不能用了。咱还是用sony的pdflrf了。
确实,k2pdfopt还有待完善,处理大文件时我都是先把TA分成若干小文件,再处理,比较麻烦。有时我嫌折腾,就切边加横屏,忍忍也就习惯了。银子多了就换DX或Pad吧。
Pingback 引用通告: ahxxm.info » K2pdfopt for itouch
我是小白。。我要用kindld看经济学人这类的四栏期刊。。求如何切割啊??用p4k或K2PDFopt都可以!非常感谢。!
早上好,Simasea。四栏的版面恐怕p4k或k2pdfopt处理的效果都不会很理想,你能不能把源文件发到我的邮箱里ever4book[at]gmail.com,我试验一下。如果有Kindle、Nook等阅读器的话,不妨直接看mobi原版,网上下载地址较多,体验也不错啊。O(∩_∩)O~
p4k不知道用切割后宽度26%,高度也26%的比例切割是不是看起来Ok
记得先切边,
切边后,让相邻的两栏内容之间的宽度为:
(白边宽度)(内容)(白边宽度)(白边宽度)(内容)(白边宽度),
这样切完之后就变为这样两页:
(白边宽度)(内容)(白边宽度),(白边宽度)(内容)(白边宽度)
你好!请问有没有切割大的pdf文件的软件?我想把一本pdf的语法书切割成小的pdf文件,然后用k2pdfopt来转换,这样就可以在我的kindle 4 touch上阅读了。谢谢!
你好,可以参考善用佳软的这篇雄文中的第3部分:PDF辅助工具:http://xbeta.info/pdf-software.htm#h3