授课内容
上一节
下一节
上课日期:第四周 2020.9.30 3-4节,西校区工程中心204
出勤统计:应到41/实到41/迟到人0
上次课我们讨论了,如果将A*算法用于树搜索问题,启发函数(heuristic function)必须乐观且实事求是(optimistic),即启发函数是“可达的”(admisible),才能确保算法求解的最优性(optimal)。
如果将A*算法用于图搜索(graph-search)问题,启发函数必须具有一致性(consistency),才能确保算法求解的最优性。
回忆一下big picture,在goal-based agent转换为search问题时,我们对环境任务的假设是ODKD,即环境是可观察的(observable)、离散的(discrete)、已知的(known)和确定性的(deterministic)。
然而,当环境任务是不确定的(stochastic)时候,Markov decision process是一个非常有用的智能体设计工具。


