目詹域
首页
Learn
易混淆-概念互动解析
强化学习核心知识仪表盘(动态交互)
Hello Halo
Halo
关于
登录
菜单
首页
Learn
易混淆-概念互动解析
强化学习核心知识仪表盘(动态交互)
Hello Halo
Halo
关于
目詹域
归档
2025 年 11 月
具体知识点-重点标记(持续更新...)
2025-11-09
第四章: 拆解概念 老师为了让学生更好地理解这个复合概念,将其拆分为三个独立的部分来讲解:过程(Process)、随机(Stochastic / 随机性)和马尔可夫(Markov) 。 过程 (Process) 核心含义: 老师首先倒着讲解,强调“过程”一定和时间相关。 具体表现: 它代表一个“时序
建模决策工具文档
2025-11-09
第一部分:问题建模(Pre-Modeling)- 我的问题是什么类型? 在选择算法之前,您必须先将您的现实问题抽象为数学框架。根据第四章的内容,您的问题可以归入以下四种主要类型之一,它们的关键区别在于**“有无动作”(Agent是纯观测还是能决策)和“是否可观测”**(状态是透明的还是隐藏的)。