用故事解釋分類問題和回歸問題
1.分類問題的故事——森林裡的神秘果子
在一片神秘的森林裡,小明發現了許多奇怪的果子。有些果子可以吃,而有些果子有毒。他想找到一個方法來區分這些果子。
他觀察到:
?顏色:紅色的果子通常是可食用的,紫色的果子通常是有毒的。
?形狀:圓形的果子大多能吃,尖尖的果子往往有毒。
?大小:太小的果子似乎更危險。
於是,小明決定建立一個“吃不吃果子”的規則係統:
?如果果子是紅色且圓形,就吃!
?如果是紫色且尖尖的,就不吃!
?其他情況要謹慎判斷。
這個過程就是分類問題——它的目標是給每個果子打上一個“可吃”或“不可吃”的標簽。
分類問題的典型特征:
答案是離散的類彆例如:“可吃”vs.“不可吃”)
數據用於區分不同類彆紅色vs.紫色,圓形vs.尖形)
最終輸出是一個標簽1=可吃,0=不可吃)
現實中的應用:
?郵件是否是垃圾郵件?垃圾vs.非垃圾)
?貸款申請者是否值得批準?批準vs.拒絕)
?識彆圖片中的動物是什麼?貓vs.狗)
2.回歸問題的故事——小明賣檸檬水
夏天到了,小明在街頭賣檸檬水。他想預測明天應該準備多少杯檸檬水,以免浪費或賣不夠。
他發現:
?溫度越高,賣出的檸檬水越多。
?天氣越晴朗,賣出的檸檬水也越多。
?濕度太高時,人們反而不太想買檸檬水。
他收集了一些數據,比如:
?昨天30°c,賣出50杯
?昨天35°c,賣出70杯
?昨天28°c,賣出45杯
他想建立一個預測模型,比如:
這樣,如果明天預測是32°c,他可以計算: