TextPro是一款功能非常实用而且小巧的的文本批处理工具。其实对于小编来说目前部分的文本处理工具,这款软件是非常强大了。我们都知道电脑有自带的记事本的文本处理的软件,但是,它的功能太限了,只能进行一些基本的本处理。所以,小编给大家带来一款功能非常多而且实用的文本处理的软件。文本处理(TextPro)的功能十分强大,它不仅能有最基础的文本处理工能,还能解决了一些较为棘手的问题,它就可以批量处理文本(超文本)文件,支持中文内码转换、简繁体转换、支持正则的查找替换、强化的查找/替换、文件合并、删除段内回车、文件比较、按行排序、删除重复行、还可调用TTS语音库朗读文本等功能,而且编码方面也大大强化了,解决了很多的编码错乱的问题.有需要的朋友赶紧下载体验吧。
2、支持GBK码繁体与简体相互转换
3、强化的查找/替换功能(正则表达式和自定义替换表)
推出自创的强大的支持双字节的正则表达式和自定义替换表功能。经过适当的组合,可以完成的功能几乎是无限的。详见 帮助文件。
4、合并文件Windows环境下合并文件的软件较少。能实现Windows环境中比较完善的文件合并功能。
内码以及简繁转换可以直接在界面上点击按钮完成,还有删除半角字符,转全角,转半角,规范行首,删除段内回车,删除置标符,按行(首)排序,删除重复行,自动分段等等功能。
软件内部采用Unicode编码。通过读入和保存不同编码的文件可以实现不同编码之间的转换。可以实现繁体汉字与简化汉字之间的互相转换。简繁汉字转换牵涉到许多问题,尤以多义字和古今用法中的异体字为难,无法兼顾。软件中的汉字转换以处理佛经(古代文体)为主,暂未顾及现代汉字特点。
软件对汉字处理的原则是:一是遵循我国现有的汉字标准;二是兼容全部BIG5码汉字;三是采用多层次的转换功能(如果文本行末有硬回车,宜使用软件的“删除换行”功能进行预处理)。后者是指除了一对一的汉字转换外,在内部转换时还采取了以词组选择多义字的方法以尽量减少转换错误;不过,要想在转换后得到完全正确的文章,仍须逐字校对。
在将文件保存到Big5编码时,可以用异体字和组字式替代Big5编码不支持的汉字。在设置->选项中可以设置是否“转成异体字”和“转成组字式”(默认为勾选转换)。
软在汉字转换之外还提供了一个补充功能:可以用自定义替换表进行汉字的替换。用法在“正则表达式和自定义替换说明”的帮助文件
(RegExp.chm)中有介绍。
简繁互转中解决了部分一对多的难题,但对复杂情形和古文还不够用,只能起到辅助作用。
在简繁互转的选项中有“下列括号对内的文字不转换”的框,如果写上[],则正文中被[]括住的文字不参与转换。有些长文本后半截未转换,经常是文中有[而无]所造成的情况,不需要此功能的人可删除选项中的[]或其它括号对即可。
强化的查找/替换功能
应用推出支持Unicode的正则表达式替换、自定义替换、批量自定义替换功能。其特点是在通用英文正则表达式的基础上强加了自己创造的中文正则表达式,例如它可匹配GBK字集、BIG5字集、以及中文数字、天干地支等。通过适当的组合,可以完成的查找/替换功能几乎是无限的。由于此功能比较复杂难学,详见“正则表达式和自定义替换帮助文件”(RegExp.chm)。TextPro在普通查找和正则表达式查找时都支持忽略回车和标点符号的选项,为查找不同版本的佛经以及网页文件提供了便利。
文件比较
能够直观对比两个文件内容异同的软件极罕见。T还可以在窗口中打开两个或三个文件,在“窗口”菜单选择“平铺”,用鼠标分别单击每个文件内容中相同的启始位置,然后连续按键盘上的“F5”按键开始比较。
发现不同字符时,程序在下方状态栏提示不相同的字符及其位置,当前激活的文件中,光标自动移到不相同的字符处,以便直接编辑,未激活文件窗口的显示位置自动随之移动。
比较时自动忽略回车和半角空格,还有“忽略全角标点符号”和“忽略半角符号”的选项可供选用。
如果在比较中失去正确的位置对应,请分别在两个文件中重新设定往下比较的起始位置。
比以前的版本增加了“忽略异体字”的选项,包括:
忽略异体字(完全等同)
忽略异体字(包括部分等同)
不忽略异体字
“完全等同”指音义全同的异体字,例如:“兔兎”。
“部分等同”指部分相同的异体字,例如“奔犇逩”。
“不忽略异体字”是最严格的比较方法,但比较速度较慢。
合并文件
T软件能实现Windows环境中比较完善的文件合并功能,有两种合并文件的操作方法:
一是手工合并文件:单击“文件|合并文件”,选择文件,排序,填好合并后的文件名,然后单击“合并”;
二是自动合并文件:对有规律的文件名可以使用正则表达式匹配要合并的文件。例如有若干文件,格式为001_001.txt、001_002.txt……、002_001.txt、002_002.txt……,可以单击“文件|自动合并文件”,对其中的源文件输入正则表达式“(\d+)_(\d+)\.txt”,目标文件名为“\1.txt”,排序关键字为“\2”,则所有以001开头的文件合并为001.txt,以002开头的所有文件合并为002.txt。
除了“文件比较”功能之外,软件可以同时对多个文件进行批处理,支持多层目录操作和文件备份。
批处理的方法是从“文件|批处理”命令或工具栏上的快捷键启动批处理窗口,然后
(1)点右侧的“文件”按钮选择需要批处理的目录或多个文件;
(2)从左下框中选择功能;
(3)选择到右侧框;
(4)根据需要设置“输入编码”和“输出编码”,点“选项”或“查找/替换”键进行细致设定;
(5)最后按“处理”键。
自定义替换的功能需要先在软件中设定,然后再进入批处理窗口。
“输入编码”是输入文件的编码,如果选“自动选择”就自动检测文件编码。请注意自动检测编码不是百分之百正确的,有可能判断错误。“输出编码”是输出文件的编码,如果选“自动选择”就保持输入文件的编码。如果选择不同的“输入编码”和“输出编码”就可以达到转码的目的。
如果用户仅需要文件转码,可以从左下框选择“转码”处理。如果已经选择了其它处理,就没有必要再选择“转码”了,TextPro会自动按“输出编码”保存文件。
软件仅改写变化的文件,如果用户选择了“建立后备文件”,在改写前会先备份文件。不需要改变的文件保留原来的修改日期。
2.删除半角字符
点“转换”菜单中的“删除半角符号”命令或其工具栏上的快捷键,可删除字母、数字、连续半角空格、或其它半角符号。此项功能需要在“设置|选项”命令或工具栏上的快捷键中设定。如果你要删除全部半角符号,请在最上一个选项打勾,否则进入下面的子项选单。
选单左面有三个单选项。当选中上面两个单选项时,下面的小输入框内可输入一些半角符号,然后选择“删除所输入的符号”或者“删除输入以外的符号”;如果是与输入符号无关的话,请选左面第三项,然后再选是“删除字母”、“删除数字”还是“删除多余空格”。
“删除多余空格”允许用户填写保留几个连续半角空格。超出指定数量的连续空格会被删除。
3.字符的半角/全角转换
“转换”菜单的“转全角”的命令可以将半角的标点符号转换到全角,转换时两个半角空格被转换成一个全角空格,默认情况下单个半角空格会被转换到一个全角空格。这个命令有两个选项:“转换半角字母数字”和“单个半角空格不转换”。
“转换”菜单的“转半角”命令把全角字母、数字和标点符号转换成对应的半角字符,一个全角空格会被转换成两个半角空格。此项命令没有选项。
规范行首和删除行末空格
点“转换”菜单中的“规范行首”命令或其工具栏上的快捷键,可使选择段落或全文的每段以两个全角空格开始,符合中文文件的规范。还可在选项中设定以哪些字符开始的段落不进行规范行首。
空行不会被增加全角空格。全是半角空格或全角空格的行会被删空。
删除行末空格是消除某些超文本文件在行末的半角和全角空格。有些网页或论坛会在行末增加的半角字符干扰码甚至加上规则的汉字,则本功能无效。不过可以用正则查找/替换来对付。
4.删除段内回车
在实际工作中可发现许多文本文件在段落中间的行末都有硬回车,不符合有些文本文件的要求。“删除段内回车”是为了解决这个问题而设计的。点“转换”菜单中的“删除换行”命令或其工具栏上的快捷键,可删除段内各行末尾的硬回车。
默认情况下,以半角空格或全角空格开始的行被认为是段开始。其它回车都被认为是段内回车而删除。
此功能有两个选项:“保留连续换行”,“新段以双空格开始”。选择“保留连续换行”后,连续两个及以上回车也被作为段分隔符。选择“新段以双空格开始”后,只有两个全角空格或4个全角空格开始的行才被认为是段开始。其它回车都被认为是段内回车。
注意:有些此类文本的段首没有空格而段落之间又没有空行,则需要手工在段落前加一回车或规范行首。
按行排序和删除重复行
TextPro实现了按行排序并删除重复行。两个功能是独立的,以满足需要删除重复行又要保持行序的用户。
6.按行排序
点“转换”菜单中的“按行排序”命令或其工具栏上的快捷键可以按照当前选项排序。目前的排序原则是按电脑默认的次序,以后将增加按拼音和笔画排序。
7.删除重复行
点“转换”菜单中的“删除重复行”命令即可删除重复行。对于重复的行仅保留第一次出现。
8.杂项功能
以下几项杂项功能也是在碰到实际需求后设计的:
9.设置快捷键和自定义工具栏
用户可在“设置”菜单中将程序固定功能和自定义替换表都设置成相应的快捷键(如下图)和自定义工具栏,以满足各人的特殊需求。
软件特色
1、支持主要的中文内码转换2、支持GBK码繁体与简体相互转换
3、强化的查找/替换功能(正则表达式和自定义替换表)
推出自创的强大的支持双字节的正则表达式和自定义替换表功能。经过适当的组合,可以完成的功能几乎是无限的。详见 帮助文件。
4、合并文件Windows环境下合并文件的软件较少。能实现Windows环境中比较完善的文件合并功能。
内码以及简繁转换可以直接在界面上点击按钮完成,还有删除半角字符,转全角,转半角,规范行首,删除段内回车,删除置标符,按行(首)排序,删除重复行,自动分段等等功能。
软件功能
1.简繁体转换软件内部采用Unicode编码。通过读入和保存不同编码的文件可以实现不同编码之间的转换。可以实现繁体汉字与简化汉字之间的互相转换。简繁汉字转换牵涉到许多问题,尤以多义字和古今用法中的异体字为难,无法兼顾。软件中的汉字转换以处理佛经(古代文体)为主,暂未顾及现代汉字特点。
软件对汉字处理的原则是:一是遵循我国现有的汉字标准;二是兼容全部BIG5码汉字;三是采用多层次的转换功能(如果文本行末有硬回车,宜使用软件的“删除换行”功能进行预处理)。后者是指除了一对一的汉字转换外,在内部转换时还采取了以词组选择多义字的方法以尽量减少转换错误;不过,要想在转换后得到完全正确的文章,仍须逐字校对。
在将文件保存到Big5编码时,可以用异体字和组字式替代Big5编码不支持的汉字。在设置->选项中可以设置是否“转成异体字”和“转成组字式”(默认为勾选转换)。
软在汉字转换之外还提供了一个补充功能:可以用自定义替换表进行汉字的替换。用法在“正则表达式和自定义替换说明”的帮助文件
(RegExp.chm)中有介绍。
简繁互转中解决了部分一对多的难题,但对复杂情形和古文还不够用,只能起到辅助作用。
在简繁互转的选项中有“下列括号对内的文字不转换”的框,如果写上[],则正文中被[]括住的文字不参与转换。有些长文本后半截未转换,经常是文中有[而无]所造成的情况,不需要此功能的人可删除选项中的[]或其它括号对即可。
强化的查找/替换功能
应用推出支持Unicode的正则表达式替换、自定义替换、批量自定义替换功能。其特点是在通用英文正则表达式的基础上强加了自己创造的中文正则表达式,例如它可匹配GBK字集、BIG5字集、以及中文数字、天干地支等。通过适当的组合,可以完成的查找/替换功能几乎是无限的。由于此功能比较复杂难学,详见“正则表达式和自定义替换帮助文件”(RegExp.chm)。TextPro在普通查找和正则表达式查找时都支持忽略回车和标点符号的选项,为查找不同版本的佛经以及网页文件提供了便利。
文件比较
能够直观对比两个文件内容异同的软件极罕见。T还可以在窗口中打开两个或三个文件,在“窗口”菜单选择“平铺”,用鼠标分别单击每个文件内容中相同的启始位置,然后连续按键盘上的“F5”按键开始比较。
发现不同字符时,程序在下方状态栏提示不相同的字符及其位置,当前激活的文件中,光标自动移到不相同的字符处,以便直接编辑,未激活文件窗口的显示位置自动随之移动。
比较时自动忽略回车和半角空格,还有“忽略全角标点符号”和“忽略半角符号”的选项可供选用。
如果在比较中失去正确的位置对应,请分别在两个文件中重新设定往下比较的起始位置。
比以前的版本增加了“忽略异体字”的选项,包括:
忽略异体字(完全等同)
忽略异体字(包括部分等同)
不忽略异体字
“完全等同”指音义全同的异体字,例如:“兔兎”。
“部分等同”指部分相同的异体字,例如“奔犇逩”。
“不忽略异体字”是最严格的比较方法,但比较速度较慢。
合并文件
T软件能实现Windows环境中比较完善的文件合并功能,有两种合并文件的操作方法:
一是手工合并文件:单击“文件|合并文件”,选择文件,排序,填好合并后的文件名,然后单击“合并”;
二是自动合并文件:对有规律的文件名可以使用正则表达式匹配要合并的文件。例如有若干文件,格式为001_001.txt、001_002.txt……、002_001.txt、002_002.txt……,可以单击“文件|自动合并文件”,对其中的源文件输入正则表达式“(\d+)_(\d+)\.txt”,目标文件名为“\1.txt”,排序关键字为“\2”,则所有以001开头的文件合并为001.txt,以002开头的所有文件合并为002.txt。
软件亮点
1.批处理除了“文件比较”功能之外,软件可以同时对多个文件进行批处理,支持多层目录操作和文件备份。
批处理的方法是从“文件|批处理”命令或工具栏上的快捷键启动批处理窗口,然后
(1)点右侧的“文件”按钮选择需要批处理的目录或多个文件;
(2)从左下框中选择功能;
(3)选择到右侧框;
(4)根据需要设置“输入编码”和“输出编码”,点“选项”或“查找/替换”键进行细致设定;
(5)最后按“处理”键。
自定义替换的功能需要先在软件中设定,然后再进入批处理窗口。
“输入编码”是输入文件的编码,如果选“自动选择”就自动检测文件编码。请注意自动检测编码不是百分之百正确的,有可能判断错误。“输出编码”是输出文件的编码,如果选“自动选择”就保持输入文件的编码。如果选择不同的“输入编码”和“输出编码”就可以达到转码的目的。
如果用户仅需要文件转码,可以从左下框选择“转码”处理。如果已经选择了其它处理,就没有必要再选择“转码”了,TextPro会自动按“输出编码”保存文件。
软件仅改写变化的文件,如果用户选择了“建立后备文件”,在改写前会先备份文件。不需要改变的文件保留原来的修改日期。
2.删除半角字符
点“转换”菜单中的“删除半角符号”命令或其工具栏上的快捷键,可删除字母、数字、连续半角空格、或其它半角符号。此项功能需要在“设置|选项”命令或工具栏上的快捷键中设定。如果你要删除全部半角符号,请在最上一个选项打勾,否则进入下面的子项选单。
选单左面有三个单选项。当选中上面两个单选项时,下面的小输入框内可输入一些半角符号,然后选择“删除所输入的符号”或者“删除输入以外的符号”;如果是与输入符号无关的话,请选左面第三项,然后再选是“删除字母”、“删除数字”还是“删除多余空格”。
“删除多余空格”允许用户填写保留几个连续半角空格。超出指定数量的连续空格会被删除。
3.字符的半角/全角转换
“转换”菜单的“转全角”的命令可以将半角的标点符号转换到全角,转换时两个半角空格被转换成一个全角空格,默认情况下单个半角空格会被转换到一个全角空格。这个命令有两个选项:“转换半角字母数字”和“单个半角空格不转换”。
“转换”菜单的“转半角”命令把全角字母、数字和标点符号转换成对应的半角字符,一个全角空格会被转换成两个半角空格。此项命令没有选项。
规范行首和删除行末空格
点“转换”菜单中的“规范行首”命令或其工具栏上的快捷键,可使选择段落或全文的每段以两个全角空格开始,符合中文文件的规范。还可在选项中设定以哪些字符开始的段落不进行规范行首。
空行不会被增加全角空格。全是半角空格或全角空格的行会被删空。
删除行末空格是消除某些超文本文件在行末的半角和全角空格。有些网页或论坛会在行末增加的半角字符干扰码甚至加上规则的汉字,则本功能无效。不过可以用正则查找/替换来对付。
4.删除段内回车
在实际工作中可发现许多文本文件在段落中间的行末都有硬回车,不符合有些文本文件的要求。“删除段内回车”是为了解决这个问题而设计的。点“转换”菜单中的“删除换行”命令或其工具栏上的快捷键,可删除段内各行末尾的硬回车。
默认情况下,以半角空格或全角空格开始的行被认为是段开始。其它回车都被认为是段内回车而删除。
此功能有两个选项:“保留连续换行”,“新段以双空格开始”。选择“保留连续换行”后,连续两个及以上回车也被作为段分隔符。选择“新段以双空格开始”后,只有两个全角空格或4个全角空格开始的行才被认为是段开始。其它回车都被认为是段内回车。
注意:有些此类文本的段首没有空格而段落之间又没有空行,则需要手工在段落前加一回车或规范行首。
按行排序和删除重复行
TextPro实现了按行排序并删除重复行。两个功能是独立的,以满足需要删除重复行又要保持行序的用户。
6.按行排序
点“转换”菜单中的“按行排序”命令或其工具栏上的快捷键可以按照当前选项排序。目前的排序原则是按电脑默认的次序,以后将增加按拼音和笔画排序。
7.删除重复行
点“转换”菜单中的“删除重复行”命令即可删除重复行。对于重复的行仅保留第一次出现。
8.杂项功能
以下几项杂项功能也是在碰到实际需求后设计的:
9.设置快捷键和自定义工具栏
用户可在“设置”菜单中将程序固定功能和自定义替换表都设置成相应的快捷键(如下图)和自定义工具栏,以满足各人的特殊需求。
∨ 展开