https://blog.philip-huang.tech/?page=rope-embedding - [图解RoPE旋转位置编码及其特性](https://mp.weixin.qq.com/s/-1xVXjoM0imXMC7DKqo-Gw) - [详解基于调整RoPE旋转角度的大模型长度外推方法](https://mp.weixin.qq.com/s?__biz=MzA3MTgwODE1Ng==&mid=2247484826&idx=1&sn=8935f0bcb2e09f438cbf3ae63825d671&chksm=9f26a069a851297f568ba7cd111082e603108716928b8444a253457233f24d09d3a18447d6b9&cur_album_id=3199751010206973953&scene=189) 簡單旋轉矩陣 一個簡單的二維旋轉矩陣,其中$\theta$表示弧度: $$M(\theta) = \begin{pmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{pmatrix}$$ 將一個二維的向量乘上該旋轉矩陣可
https://blog.philip-huang.tech/?page=rope-embedding
图解RoPE旋转位置编码及其特性
详解基于调整RoPE旋转角度的大模型长度外推方法
簡單旋轉矩陣
一個簡單的二維旋轉矩陣,其中$\theta$表示弧度:
將一個二維的向量乘上該旋轉矩陣可