当前位置:网站首页>第二课:概率论
第二课:概率论
2022-08-08 22:47:00 【Sarah ฅʕ•̫͡•ʔฅ】
一、生成模型 与 判别模型的区别

判别模型 is better than 生成模型;
二、评估模型表现的指标 ROC
当数据label不平衡时,无法用“准确率”来评估模型表现,此时,可以用ROC,评估模型表现:
ROC曲线绘制步骤:分别取若干比重的data计算TPR和FPR,每个比重的data均可得到一个point,将这些point连线即为ROC曲线。
得到ROC曲线,即可根据AUC(area under curve)来评估模型表现的优劣,AUC越接近1,其表现越好,越接近0.5,表明其prediction为random 行为,表现很差。值得注意的是:当AUC接近0时,也可以说模型表现很好,因为只要把prediction的label对调,其准确率就会很高。
除用ROC评估模型表现外,也可以用recall-precision 曲线来评估模型表现,同样的,曲线面积越大,说明模型表现越好,如下图所示:
三、离散变量和连续变量 P(x)=0是不是一定不可能发生?
对于“离散变量”,P(x)=0是一定不可能发生的;
但是,对于“连续变量”,P(x)=0是可能发生的;
四、COV 和 COR 都是线性相关的 表征量


五、蒙特卡罗 方法
基本思想:当所求解问题是某种随机事件出现的概率,或者是某个随机变量的期望值时,通过某种“实验”的方法,以这种事件出现的频率估计这一随机事件的概率,或者得到这个随机变量的某些数字特征,并将其作为问题的解。
六、信息论
- 熵

- KL DIVERGENCE

- 互信息
互信息可以表征两个特征的相关性,当互信息=0,说明两个特征互相独立。
边栏推荐
猜你喜欢
随机推荐
新安装Laravel Framework 6.18.35 php artisan migrate 报错
The concept of GIL and pools
国产GPU大厂景嘉微半年净利润1.25亿元 旗下产品大卖
三国战绩 风云再起 网络版 物品序号 和 基址列表
浅析WLAN——无线局域网
IMConversation 或 IMUser 类型数据
Ant Forest Offline crawlers automatically collect energy, raise chickens, and other operations
论文阅读 (66):Explainable Deep Feature Embedding Using Multiple Instance Learning for Pathological Image
虚拟路由冗余协议VRRP——双机热备份基础
从洞察到决策,一文解读标签画像体系建设方法论丨DTVision分析洞察篇
Unity ScrollView无限循环左右滑动翻页带阻尼效果
基于.NET6、FreeSql、若依UI、LayUI、Bootstrap构建插件式的CMS
巨头杀入的LMFP,是未来正极材料的新归宿?
请问:支付宝上买基金安全吗
The Socket (Socket)
Go 1.19 发布!
买股票要选择哪家证券公司更好?网上客户经理开户安全吗
Node中的Events模块怎么应用
MySQL8.0 及 SQL 注入
C language library function summary2019.10.31









