首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > Python > python 实现随机森林

python 实现随机森林

资 源 简 介

应用背景 数据   :两个月之内 40000个客户的15个数据字段   包含客户的 地          理位置,职业,职级,年收入,。。。。。。    购买过得产品 目的:对新客户进行推荐一个适合该客户的产品, 对老客户推荐可能再购买的产品 数据处理    数据清洗:   describe 每个特征统计分析       方差     -分析缺陷特征和波动性                 空值赋值为  “-1 “              -  保证模型的可使用    数据归一化:eg:邮编 相似度不高 根据一线二线….进行划分  – 特征的重要性 关键技术特征选择    随机森林:  判断特征的重要性 :思考为何重要性高     AHP    :  迭代设置每个特征的权重 模型选择   :根据数据量数量,是否有标签,分类or回归选取 关于模型选择时候我想用协同过滤  但是不知道关于特征的协同过滤是怎么执行的   是每个特征都有一个评分构成评价矩阵么?

文 件 列 表

datachange.py
VIP VIP
0.179591s