0.先把这本制作好的书发出来吧,还有一点小问题,懒得调整了
https://mega.nz/#!5oxk0YZR!syuznCfGTrk_YEoNCn1jj7-fHwnxUYec85NVZaOJA3U
http://pan.baidu.com/s/1jIg03xO 密码:b3gm
1.应该先获取这本书的源文件
一般来说,现有的书在网上的电子资源无非以下几种
a.排版精美的prc/epub/mobi/azw3,这种少部分是网友精心排版,大部分是从各个书城流出来的。
b.排版不甚精美的epub/mobi/azw3,这种一般都是网友自己转的,但是格式掌握的不好。
c.排版较好的pdf,也有可能是出版社流出或者某些网友自制。
d.扫描的pdf,这种最坑爹。
前两种情况,一般来说直接看就可以。除非书上有一些本来应该有的地方没有。比如说亚马逊有些书注释不加跳转,无语。
第三种情况,如果我还是用多看系统的话,那就直接放进去看了,反正多看有自动重排,但是kindle原生系统不行,所以我一般先转成txt,稍微处理一下换行之类的东西,然后加个目录转成mobi再看,但是一般不会太用力。
第四种情况,以前用多看也可以直接重排,现在ko又不支持,暂时没啥好办法。直接拿回kpw,用上面的多看系统看。其实如果扫描的特别清晰的话可以用abbyy转成文档然后编辑。不过太麻烦。
以《戚本禹回忆录》为例,网上的资源就是类型c。
2.处理简单的段落空行等
pdf大部分情况有一个问题,就是多了很多换行符。
以《戚》中原版pdf的一段为例:
因为pdf没法直接编辑,我选择将pdf先转成txt(用acrobat)。转换之后的效果如图
这显然在epub等流式电子书里面显示是非常糟糕的。因此我们需要删掉这些并不是真正应该有的换行符。
我选择使用正则表达式:
(?<=[u4e00-u9fa5])rn
这个正则表达式的意思是:如果一个换行符前面是汉字,那就删掉这个换行符。以此类推,如果一个换行符前面是逗号,我们也可以这样删掉这个换行符。
处理之后的段落如下:
3.错别字,错误的段落划分和标点使用
一本书里面难免出现这些,但是在之前处理过的文本中,如果出现了这些那基本上就是源文件就是这样,如果要处理的话也要先找到才行,那就得先把原书读一遍了。
或者可以跳过这一段。
4.给书划分章节
这一段我使用word来处理。具体可以参考精益的
http://www.jebook.org/index.php/archives/437
5.制作成epub电子书格式
这里我也参考了精益的http://www.jebook.org/index.php/archives/445
6.处理注释
这本书里很多注释是以【】 形式附加的,我用java写了几个规则来把他们变成kindle格式的注释,代码附在下面了,比较简单。(要先自己把epub解包,处理完再打包
addfootnote
注释的写法参考了amazon公布的kindle格式出版物发布指导
7.用sigil微调
目测直接解包打包会丢掉一些epub里面的东西,但是用sigil打开这个新打包的epub会自动修正。
除此之外,由于一些其他方面的修正不方便对epub进行操作(总是解包打包多麻烦),可以用sigil进行。
对于本书,是因为书中注释格式不规则,我又在里面进行了调整。
8.关于字体
用jutoh生成的epub中,正文格式如下
<p class=”P_Normal”>正文</p>
而在css样式表(如果你按照精益网站那篇文章照做,就发现他们使用了老牛的样式表)里面我们规定P_Normal使用的字体
.P_Normal {
text-align: justify;
font-family: “zw”,”宋体”,”明体”,”明朝”,serif;
}
所以,问题来了,我们把这个文件转成mobi或者azw3放在kindle上之后,都会强行指定正文字体到一个特定字体。
解决办法是把
font-family: “zw”,”宋体”,”明体”,”明朝”,serif;
这一句删掉。
9.现在,大功告成^_^
5 responses to “如何制作一本排版精美到强迫症患者也能喜欢的kindle电子书——以《戚本禹回忆录》为例”
云盘分享被取消了,能发到邮箱或上传到国内的网盘不.
https://mega.nz/#!5oxk0YZR!syuznCfGTrk_YEoNCn1jj7-fHwnxUYec85NVZaOJA3U
http://pan.baidu.com/s/1hs2iVwK
baidu盘密码多少?
重新分享了,更新了博文里的百度盘链接
多谢!