
本工具功能介绍:
1.自定义限制语料文本的最低字数。
2.自定义限制语料文本的最高字数。
3.自动检索重复的TXT文本。
4.保存标准语料。
这样有利于更方便的整理清洗语料。将符合要求的语料进行预处理成可训练文件。

清洗完成后,会保存以下四个文件夹。将清洗的相关条件TXT语料文本对应保存。

声明:由于此工具并非AI项目配套必须品(在你采集整理数据的时候完全可以人工清洗相关不符合条件的语料文本),此工具只为拓展协助你更快的清洗语料要求,提升使用者的方便,所以本工具需另收费。本工具仅限用于我们AI-CPM项目。
暂定价格:168元(买断制)
官方接语料数据定制服务,有需要随时联系,提取语料需求即可。精准定制。