什麼是機器學習中的鉸鏈損失？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

什麼是機器學習中的鉸鏈損失？

Lisa Kudrow

Mar 14, 2025 am 10:38 AM

鉸鏈損失：分類任務中的關鍵要素，尤其是在支持向量機（SVM）中。它通過懲罰附近或跨越決策邊界的人來量化預測錯誤。這種強調類之間的穩健邊距可以改善模型的概括。本指南深入研究了鉸鏈損失基本面，其數學基礎以及適用於新手和經驗豐富的機器學習從業人員的實際應用。

什麼是機器學習中的鉸鏈損失？

了解機器學習的損失
損失功能的關鍵方面
鉸鏈損失解釋了
鉸鏈損失的操作機制
利用鉸鏈損失的優勢
鉸鏈損失的缺點
Python實施示例
概括
常見問題

了解機器學習的損失

在機器學習中，損耗函數衡量模型的預測與實際目標值之間的差異。它量化了錯誤，指導模型的訓練過程。最小化損失函數是模型訓練期間的主要目標。

損失功能的關鍵方面

目的：損失功能指導訓練期間的優化過程，使模型能夠通過懲罰不准確的預測來學習最佳權重。
損失與成本：損失是指單個數據點的錯誤，而成本代表整個數據集的平均損失（通常與“目標函數”互換使用）。
類型：損失功能因任務而異：
- 回歸：平均誤差（MSE），平均絕對誤差（MAE）。
- 分類：橫向滲透損失，鉸鏈損失，Kullback-Leibler Divergence。

鉸鏈損失解釋了

鉸鏈損耗是主要用於分類的損失函數，尤其是在SVM中。它評估了模型預測與真實標籤的一致性，不僅有利於正確的預測，而且有利於通過邊緣分離的預測。

鉸鏈損失懲罰了：

錯誤分類。
正確分類，但離決策邊界太近（在邊距內）。

此保證金創建增強了分類器的魯棒性。

公式

單個數據點的鉸鏈損失是：

什麼是機器學習中的鉸鏈損失？

在哪裡：

Y ：實際標籤（SVM的1或-1）。
F（x） ：預測得分（閾值之前的模型輸出）。
最大（0，...） ：確保非負損失。

鉸鏈損失的操作機制

正確且自信（y·f（x）≥1）：無損失（l（y，f（x））= 0）。
正確但不自信（0 損失與邊緣距離成正比。
不正確（y·f（x）≤0）：損失隨誤差幅度線性增加。

什麼是機器學習中的鉸鏈損失？

利用鉸鏈損失的優勢

邊緣最大化：對於SVM至關重要，導致更好的概括和對過度擬合的抵抗力。
二進制分類：對具有線性分類器的二進制任務非常有效。
稀疏梯度：提高計算效率。
理論基礎：基於利潤的分類中的強大理論支持。
異常魯棒性：降低正確分類的異常值的影響。
線性和非線性模型：適用於線性和基於內核的SVM。

鉸鏈損失的缺點

僅二進制分類：直接適用於二進制分類；多級問題所需的擴展。
非差異性：在y·f（x）= 1處的非差異性，需要次級方法。
對不平衡數據的敏感性：可能會偏向不平衡的類別分佈。
非穩態輸出：不提供概率輸出。
嘈雜的數據較低：對邊界附近的錯誤分類點更敏感。
有限的神經網絡支持：與跨凝性相比，在神經網絡中較不常見。
可伸縮性挑戰：對於大型數據集而言，計算上的昂貴，尤其是對於內核SVM。

Python實施示例

來自Sklearn.svm導入線性
從sklearn.datasets導入make_classification
來自sklearn.model_selection導入train_test_split
來自sklearn.metrics導入精度，classification_report，confusion_matrix
導入numpy作為NP

＃...（原始輸入中提供的代碼）...

登入後複製

什麼是機器學習中的鉸鏈損失？