天泽龟的龟壳屋
首页
归档
标签
分类
关于
友链
番剧
《动手学强化学习》学习笔记【四】
本章内容参考:【【强化学习的数学原理】课程:从零开始到透彻理解(完结)】
日麻牌效率理论札记【其二】
脑子:学会了。手:断幺九!
日麻牌效率理论札记【其一】
科学麻将死路一条。
《动手学强化学习》学习笔记【三】
时序差分算法 对于大部分强化学习现实场景(例如电子游戏或者一些复杂物理环境),其马尔可夫...
CS224N 学习随笔【完】
LLM is all you need.
《动手学强化学习》学习笔记【二】
“思想总是走在行动的前面,正如闪电总是走在雷鸣之前。” — — 海涅
【转载】浅谈大模型分布式训练并行技术
转载自:用通俗易懂的方式讲解大模型分布式训练并行技术:概述_大模型训练 资源分配-CSDN博客
《动手学强化学习》学习笔记【一】
第一节 初探强化学习
OpenAI o1 调查报告
应该整点(伪)技术性文章了。
CS224N 学习随笔【一】
一些比较过时的内容,但也可以说是当代 NLP 的基石。
下一页