分类算法

分类是一种重要且流行的机器学习工具,可将数据集中的项分配给不同的类别。分类用于在欺诈检测、文本分类等方面预测随时间变化的风险。分类函数从具有不同的已知类别的数据集开始。例如,假设您想根据学生进入研究生院的可能性对他们进行分类。除了入学考试分数和等级等因素外,您还可以跟踪工作经验。

二进制分类意味着结果(本例中的结果为“录取情况”)只有两个可能的值:录取或不录取。多类结果有两个以上的值。例如,低、中或高录取机会。在训练过程中,分类算法查找结果和特征之间的关系。这种关系在模型中进行了总结,然后可以应用到类别未知的不同数据集。