犹记得刚念本科的时候,曾经一度宿命论地将人生比作Markov状态转移,觉得无论中间态如何,人生最终都会收敛到一个稳态。后来发现这样的认知太过狭隘,人生是由不断变化的环境和做出的选择决定的,广义上讲是一个MDP过程。而MDP过程需要在环境已知的条件下,才能对状态和策略价值进行计算。 但人生的状态价值和一个个选择对应的策略价值往往很难估计(尽管可以拿他人成功或者失败的经验轨迹作为参照),沉浮乃常事,重要的应该是具备不断试错和反思的能力,跳出舒适区的勇气,和看破一时成败得失的平常心。
RGB3Q/blog.github.io
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|