用故事解释分类问题和回归问题
1。
分类问题的故事——森林里的神秘果子
在一片神秘的森林里,小明发现了许多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一个方法来区分这些果子。
他观察到:
?
颜色:红色的果子通常是可食用的,紫色的果子通常是有毒的。
?
形状:圆形的果子大多能吃,尖尖的果子往往有毒。
?
大小:太小的果子似乎更危险。
于是,小明决定建立一个“吃不吃果子”的规则系统:
?
如果果子是红色且圆形,就吃!
?
如果是紫色且尖尖的,就不吃!
?
其他情况要谨慎判断。
这个过程就是分类问题——它的目标是给每个果子打上一个“可吃”或“不可吃”的标签。
分类问题的典型特征:
答案是离散的类别(例如:“可吃”
vs。
“不可吃”)
数据用于区分不同类别(红色vs。
紫色,圆形vs。
尖形)
最终输出是一个标签(1=可吃,0=不可吃)
现实中的应用:
?
邮件是否是垃圾邮件?(垃圾
vs。
非垃圾)
?
贷款申请者是否值得批准?(批准
vs。
拒绝)
?