292
321
6311
版主
【编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法对已知的训练数据做统计分析从而获得规律,再运用规律对未知数据做预测分析,已成为文本分类领域的主流。InfoQ联合“达观数据“共同策划了《文本数据的机器学习自动分类方法》系列文章,为您详细阐述机器学习文本分类的基本方法与处理流程。 本文为第一部分,着重介绍文本预处理以及特征抽取的方法。
11.png (29.63 KB, 下载次数: 670)
下载附件
2016-6-26 14:43 上传
32.jpg (7.2 KB, 下载次数: 659)
23.jpg (25.68 KB, 下载次数: 676)
4.png (55.2 KB, 下载次数: 671)
使用道具 举报
本版积分规则 发表回复 回帖后跳转到最后一页
查看 »
|Archiver|手机版|小黑屋|陕ICP备15012670号-1
GMT+8, 2025-2-24 16:51 , Processed in 0.075946 second(s), 27 queries .
Powered by Discuz! X3.2
© 2001-2013 Comsenz Inc.