下面就是小编带给大家的多标签分类的阈值如何自适应方法操作,希望能够给你们带来一定的帮助,谢谢大家的观看。
方法/步骤
1、常数阈值函数:常见的选择为0或者0.5。比如取0.5,当给定标签预测值大于它时,被判定为存在,反之不存在。
2、tanh激活函数的优化:它的原始公式为:(Math.exp(x)-Math.exp(-x))/(Math.exp(x)+Math.exp(-x))。
3、为了提高运行效率:转化为2.0/(1.0+Math.exp(-2.0*inputValue))-1.0它们作了等价变换。
4、其中Hj表示标签j出现这一事件,m表示样本总数水貔藻疽,s是平滑项,通常取1。Kj[r]数组表示当前标签为1并且K相邻样本中标签为1的个数为r的样本总数。表示当前样本K近邻中标签j为1的个数。
5、其中P(Hj|Cj)表示未知样本K近邻中标签j僭轿魍儿为1个数为Cj条件下,该样本标签j也为1的概率,P(Hj)表示样本集中标朱逦垆肝签j为1的概率,P(Cj|Hj)表示当前样本标签j为1条件下,K近邻中标签j为的个数为Cj的概率。
6、multi-labelclassificationproblem:多标签分类(或者叫多标记分类),是指一个样本的标签数量不止一个,即一个样本对应多个标签。