数据中拼写错误的检查与纠正
作者:
钟声,黎苗苗
来源:
暂无
日期:
暂无
文献类型:
期刊
关键词:
JAVA
数据库
kettle
描述:
随着我们社会信息的日趋复杂,人们在制作个人信息时难免出现一些拼写格式上的错误。这些错误虽小,但常常给人们带来不必要的损失。随着科学技术的发展和统计学习方法的有效应用,近年来,自然语言处理技术已经成为语义搜索以及人工智能的重要研究方向。自然语言处理的重难点是对英文文本中单词与语法的错误进行检测与纠正。本论文基于kettle这个最新软件,通过将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程,对数据进行统一的格式处理。