衛卜先知

研究流程

模型預測結果

因為違規資料嚴重右偏,為了避免造成預測偏差,本專案先將違規資料以分類模型分類成高風險及低風險違規餐廳,
再針對高風險 (即嚴重右偏的違規資料) 以回歸模型分別對輕度、中度、重度違規進行違規次數的預測。

* 準確率定義:若 (|預測值 - 實際值| <= 1) 視為預測正確,反之則視為預測失敗。*
* 最終準確率 = 預測為低風險的比例 * 分類準確率 + 預測為高風險的比例 * 迴歸準確率 * 分類準確率。*

特徵#1
運用情感分析掌握餐廳評論的基本輿情

對餐廳的評論文字做TextBlob情感分析,掌握餐廳的基本輿情;
情感分析分數越低,違規程度越高。