避免过拟合的方法中,有一种称为特征选择(Feature Selection),即选择最重要的特征、同时舍弃不重要的特征。
本文以 Wine 数据集为例,使用随机森林演示了特征重要性评估和选择方法。
TensorFlow 简介及安装
发表于
|
分类于
AI
本文对 TensorFlow 相关概念和安装流程(基于 Windows 操作系统)进行介绍,并说明了 GPU 适用于机器学习的原因。
2018 年 1 月 27 日,更新 TensorFlow GPU 1.5.0 的安装教程(基于 CUDNN 7 和 CUDA 9)。
Pandas 入门教程
发表于
|
分类于
Python
Pandas 是用于数据分析 Python 的软件库,提供了大量快速便捷地处理数据的函数和方法。
本文翻译自官方文档 10 Minutes to pandas 。
核技巧和非线性 SVM
发表于
|
分类于
AI
在原始 SVM 只支持线性样本的基础上,引入核技巧(Kernel Trick)可以对非线性的样本进行分类。
算法思想为将输入向量映射到高维空间,然后用超平面划分。本文中有举例说明。