北邮数据挖掘文本分类实验

您所在的位置:网站首页 数据挖掘数据预处理实验报告心得 北邮数据挖掘文本分类实验

北邮数据挖掘文本分类实验

2024-07-17 17:03| 来源: 网络整理| 查看: 265

首先需要说明的是,这是北邮王晓茹老师的数据挖掘与数据仓库这门课的文本分类的实验。实验要求如下

实验一文本数据的分类与分析 【实验目的】 1.掌握数据预处理的方法,对训练集数据进行预处理; 2.掌握文本建模的方法,对语料库的文档进行建模; 3.掌握分类算法的原理,基于有监督的机器学习方法,训练文本分类器; 4.利用学习的文本分类器,对未知文本进行分类判别; 5.掌握评价分类器性能的评估方法。

【实验类型】 数据挖掘算法的设计与编程实现。

【实验要求】 1.文本类别数:>=10类; 2.训练集文档数:>=500000篇;每类平均50000篇。 3.测试集文档数:>=500000篇;每类平均50000篇。 4.分组完成实验,组员数量



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3