该工具主要解决当采集或者整理回来的TXT数据,第一行没有标题的时候,但是文件名是标题,就可以把文件名处理加入TXT原始内容为第一行,做训练数据的标题。
本工具会采用以下规则:
当原始文档内,第一行为文件名一致时,则会过滤。
当原始文档内,第一行是文件名时,第二行不为空,则会处理第二行为空。
当原始文档内,符合第一行为文件名,第二行为空,则不会处理,只会将该文档移动保存至工具的处理完成路径内。
当用户选择使用本工具时,请确定是否符合以上条件,否则当您的原始文档内有标题时,但是不与文件名一致,则本工具会把文件名处理到原始文档第一行做训练数据的标题。
例如:您的文档是以下效果:
该文档第一行并没有标题,也没有空行。软件则会采用文件名作为标题,处理效果如下: