1. 什么是HMM模型HMM模型,又叫隐马尔可夫模型,主要用于求解序列的隐状态。HMM是一个生成模型,通过隐状态之间的转移矩阵和隐状态到观测状态的发射矩阵决定隐状态和观测状态的联合分布。HMM模型有三个假设,第一个是观测独立性假设,序列每个时刻的观测状态仅与序列在该时刻的隐状态有关,即 P(o_1, ...
GBDT、Xgboost和LightGBM
发表于
更新于
1. 什么是GBDTGBDT又叫梯度提升树,使用CART决策树作为基学习器,利用Boosting的集成思想训练模型。与AdaBoost不同,每轮学习GBDT不会根据训练结果调整样本权重,而是希望求得一个学习器$h_m$使得目标函数达到最小,即: h_m=arg\min_{h_m}\sum_i L(y ...
Bagging(随机森林)和Boosting(AdaBoost)
发表于
更新于
1. 什么是Bagging(随机森林)Bagging的思想是均匀地、有放回地从大小为D的数据集采样出M个样本构成数据集,总共采样N次用于分别训练N个模型,在预测阶段使用这N个模型共同决定样本的分类或回归结果。在这里,随机森林是一个很好的例子。随机森林就是学习N棵决策树共同决定样本的预测结果。随机森林 ...