[toc]第一章 导论强化学习就是学习做什么能使得到的数值话的收益信息最大化。试错和延时收益是强化学习的最大特征。强化学习系统有四个核心要素: 策略,收益...
一. 加法模型adaboost算法,随机森林,提升树这些模型都可以表示如如下的形式:, 0<v<=1, 越小的步长,意味着更多的分类器,可以避...
股票系列1. Best Time to Buy and Sell Stock只能购买一次,则选取前i个中最小的和当前作差,记录最大的2. Best Tim...
从决策树到随机森林一.决策树决策树可以看做是一堆if—then集合,这个和我们人类做判断的逻辑非常相似。能够正确分类训练数据的决策树可能有很多个,也可能不...
相关资料:背包九讲https://www.kancloud.cn/kancloud/pack/70134内容较多,分两周做题目题目来源https://ww...