注冊
登录
论坛
搜索
帮助
导航
私人消息 (0)
公共消息 (0)
系统消息 (0)
好友消息 (0)
帖子消息 (0)
正则表达式论坛
»
答疑解惑
» 求文本整理正则。
返回列表
发帖
zghk
发短消息
加为好友
zghk
当前离线
UID
92
帖子
7
精华
0
积分
4
阅读权限
10
在线时间
3 小时
注册时间
2009-7-14
最后登录
2011-4-9
新手上路
1
#
跳转到
»
倒序看帖
打印
字体大小:
t
T
发表于 2010-4-4 23:47
|
只看该作者
求文本整理正则。
问题描述:从网上下载下来的TXT电子书,格式及排版比较混乱,在手机中阅读不便。
需求:
1、关于断行,有的断行不是以段落断行,而是以字数自动断行。
调整思路:将
行末没有标点或标点是逗号
的的换行符替换。
2、关于序号,对于1、....../2、....../3、.....这样的序号,能够自够分行。
其它调整使用文本处理器来处理,细节通过手工调整。
这是我的一个思路,但我对正则表达式不太熟,特来求此表达式。当然如果有更好的方案,也欢迎送出。
关于工具,打算使用Emeditor,因为经过试用,只有Emeditor打开大的文本文件速度比较流畅。
收藏
分享
rex
发短消息
加为好友
rex
当前离线
UID
2
帖子
464
精华
0
积分
254
阅读权限
200
在线时间
224 小时
注册时间
2008-11-3
最后登录
2012-2-3
管理员
2
#
发表于 2010-4-6 07:25
|
只看该作者
格式及排版比较混乱=>的确, 而且各自的混乱方式还不相同. 因此较难写出统一的替换工具. 只能针对具体的论坛或图书格式写相应的工具.
但是也可以写一些通 的脚本, 对文本作预处理. 例如你写的两个思路.
关于断行=>将行末没有标点或标点是逗号的的换行符替换=>描述很具体,可以直接写成正则表达式。
关于序号=>只需要在\d、之前插入换行符就可以了。
在答疑解惑版提问时,请注明所用语言、范例文本、匹配结果。谢谢!
------------------------------------------------------------------------------
我爱正则表达式
GTalk: rex[at]zhasm[dot]com
Twitter:
rex_zhasm
TOP
snopo
发短消息
加为好友
snopo
当前离线
UID
1821
帖子
31
精华
0
积分
24
阅读权限
10
在线时间
35 小时
注册时间
2010-6-23
最后登录
2011-10-22
新手上路
3
#
发表于 2010-6-24 10:36
|
只看该作者
匹配
(?<=[^。])\r\n
直接替换。(解决断行问题,段落结尾也可能是!之类的,按需更改吧。)
RegexBuddy下测试可以。
TOP
泡人
发短消息
加为好友
泡人
当前离线
UID
212
帖子
9
精华
0
积分
0
阅读权限
10
在线时间
3 小时
注册时间
2010-1-8
最后登录
2011-1-28
新手上路
4
#
发表于 2010-7-27 18:53
|
只看该作者
在emeditor中使用宏“排版脚本中华太阳系联盟增强版(08.09.29).jsee”,网上可以找到。非常好用,专门为整理电子书用的。
TOP
zghk
发短消息
加为好友
zghk
当前离线
UID
92
帖子
7
精华
0
积分
4
阅读权限
10
在线时间
3 小时
注册时间
2009-7-14
最后登录
2011-4-9
新手上路
5
#
发表于 2010-8-5 13:40
|
只看该作者
我去下载了一个4楼推荐的脚本,谢谢
TOP
rex
发短消息
加为好友
rex
当前离线
UID
2
帖子
464
精华
0
积分
254
阅读权限
200
在线时间
224 小时
注册时间
2008-11-3
最后登录
2012-2-3
管理员
6
#
发表于 2010-8-5 16:25
|
只看该作者
回复
5#
zghk
没找到。能否上传到这里?如果不能上传,可发给我。谢谢!
TOP
返回列表
网海文摘
书记答疑
正则利器
搜索引擎
闲聊灌水
开发应用
正则引擎
学习资料
站务管理
广告招聘
[收藏此主题]
[关注此主题的新回复]
[通过 QQ、MSN 分享给朋友]