正则表达式如何切割文章
⑴ 正则表达式 分解一段文章。。按章节分解开来。可以实现吗
下面的正则表达式要用多行模式,而且假设章节号前面没有空格,章节号中的点为英文
^\d+\.(\d+)?.*?(?=(\s+^\d+\.(\d+)?|\Z))
⑵ 求 分割文章成句子的 正则表达式.
问题描述的太简单了,至少应说明以什么语言实现,文章是什么语言的,内以什么标准判断是一个容句子(比如引号中的句子是否也单独作为一句等)。
回答补充:
(^|(?![。?!…]))[“]?[^。?!…]+[。?!…][…]?[”]?
基本逻辑就是从一行开头或者上一个句子结束标点匹配到下一个句子结束标点(所以句子前的空格也会被匹配进句子)。另外,对特殊的如双引号和省略号(两个…组成)做了处理。应该基本可以满足你的要求,但是遇到含有引号的句子时还有问题。
比如:
XX说:“啊?哦。你还是走吧!”
→
{'XX说:“啊?','哦。','你还是走吧!”'}(引号被划分到不同句子中)
“这究竟是怎么回事呢,同志们?”厂长严肃地说。
→
{'“这究竟是怎么回事呢,同志们?”','厂长严肃地说。'}(句子结构被破坏,下同)
“还愣着干吗?”妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”
→
{'“还愣着干吗?”','妈妈大声地训斥我,“等会儿老师来了,看你怎么办……”'}
能力有限,等待高手出现……
⑶ 正则表达式如何分割这个字符串
/("([^"]+)"|(?<=,)([^,]+))/
这个是匹配的
⑷ 如何切割文本文档
假设你要把每行限制在11个字之内,用Replace
Pioneer的正则表达式功能,把每11个非换行字符后加内一个换行符容。步骤:
1.
ctrl-o打开文本文件
2.
ctrl-h打开替换窗口
在Search
for
pattern下输入[^\n]{11},在Replace
with
pattern下输入$match\n即可
3.
点击Replace即完成。ctrl-s存盘。
⑸ 正则表达式如何按"|"分割字符串
你这个没有明确的分隔符,而且还有"A、中A、国"这种特殊情况,用正则都很难办到, 可以考虑遍历所有字符,检查"x、"组合,x由A开始并按ASCII顺序递增,也许只能这样了.
⑹ 如果一篇文章太长,如何将它分割为几个部分
任何文章都要分成若干个段落,每个段落都有自己相对独立的内容和中心,它就像一座摩天大厦,是由各个楼层组成的;它就像一个超市,是由各种商品组成的;它就像一台电脑,是由各种零部件组成的。
段落又是由什么组成的?是由若干个句子组成的,各个句子联合在一起,表达一个更完整的意思,形成一个段落。
文章如何分段,有几个标准,几个准则:
1、以所写事件的过程分段,就是以事件的开始、发展、高潮、结局来分段。
2、按时间顺序分段,先发生的在前,随后发生了什么,接着发生了什么,最后发生了什么,依次写下来。
3、按所写事件的地点分段,将在甲地发生的事独立成段;再将在乙地发生的事分成一段;在丙地又发生的事,也分成一段……
4、按人物的活动情况分段,将各种情况分成独立的段。
5、按场面的变化,场景的变化做为分段依据,尤其在写参观记游记时,随着所站位置的变化,所见到的景物也在变化,所以要分段写。
6、作者描写角度的变化也是分段依据。以这个角度写某件事、某个人、某个景要分成段,换另一个角度,还写同一个人、同一个景,当然也要另外分成段。
7、在叙述中穿插了较长的抒情或议论,可以独立成段。
另外,除了这七个原则以外,文章的体裁和内容对分段也起一定的影响作用。要视具体情况决定。
我们掌握分段的原则是很必要的。一篇文章的好坏与分段是否成功有直接关系。分段正确,文章的层次感就强;分不好,文章就像一团乱麻,读起来理不出头绪,分不清轻重。分段的知识和技巧决定了结构,直接关系文章的布局成败。
现在很多同学的作文不论什么内容,不论多少文字,统统都是"三段论",一律以"开头"、"中间"、"结尾"为依据来分段。我们说这是不科学的,因为"中间"部分是很庞大的,它包括好多内容,怎么能统统放在一个段落里呢?学会分段,走出"三段式"的怪圈,增加文章的层次感是当务之急。
⑺ 正则表达式按指定长度切割字符串
PHP 代码:
$str="abcdefghij";
if (preg_match("/(.)(...)(..)(....)/",$str,$matches)) {
$str1=$matches[1];
$str2=$matches[2];
$str3=$matches[3];
$str4=$matches[4];
}
加了打复印制语句:
print '('.$str1.')';
print '('.$str2.')';
print '('.$str3.')';
print '('.$str4.')';
测试结果:
(a)(bcd)(ef)(ghij)
不知是不是版本问题?我的php版本是4.4.9
⑻ JAVA中怎么用正则表达式匹配切割"12344asdff%~!@###uio"
String s = 12344asdff%~!@###uio
s.split("(.)\\1(?!\\1)",3);
现在没有环境,我这里不好测回试,你试试
----
刚测了下,发现不行答,3个叠词 的不行,(?<!\1)(.)\1(?!\1)这个不知道行不行,在线测试里不支持零宽负向后发断言,不确定能不能捕获到匹配前的位置,这样要还不行的话,建议从程序代码生成数据规范性方面进行考虑
⑼ 如何按正则表达式分割文件
你看看这个,这里各种文件切内割都有容
http://bbs.csdn.net/topics/360068462
⑽ 求教一个字符串切割的正则表达式
print_r(explode(',',',11,aa,,bb,'));