bayes_model

使用朴素贝叶斯分类器，对新闻数据进行分类

##分为三步骤 ###1 数据的预处理

###2 模型的训练

createVocabList() 获取到训练数据的词袋
将新闻数据表示成词向量
根据朴素贝叶斯公式进行计算
本程序采用多项式进行计算
模型参数为每个类别的词权重向量和类别在的先验概率。 trianNB()
return p0Vect,p1Vect,p2Vect,pAuto,pBusiness,pSport

###3 模型的评估 "Usage [%s] [train] [test] [model] [result]" 示例：./python ./test_data/train_data.txt ./check_data.txt model.txt result.txt 2>log

train_data.txt 训练数据 check_data.txt 测试数据 model.txt 模型得到参数存储文件 result.txt 评估结果文件

准确率在 96.2%

###参考《Machine Learning in Action》

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
bin		bin
test_data		test_data
README.md		README.md
test_model.py		test_model.py

Provide feedback