Transformer - LLM 从零开始 (Part 1: Attention)

0. 写在前面 为什么有这篇文章? 希望自己可以以此为切入点详细过一遍 LLM 相关的知识点和实现细节。 同时,多年来的科研和工作经历中体会到了知识只【输入】往往只会停留在似是而非的程度,只有【输出】才能真正内化成自己的东西。而且,【输出】的的逻辑性和组织性本身也是一种能力的培养。 希望这会是一个系列文章,可以一直更新下去。 ...

2023-12-07 · 8 分钟 · Ian Chen