FlashAttention V1 学习笔记
ConvRAG:通过细粒度检索增强和自我检查提升大模型对话式问答能力
论文阅读:A Survey on Data Selection for LLM Instruction Tuning
RoPE + 位置线性内插
论文阅读:GQA: Training Generalized Multi-Query Transformer Models from Multi-Head Checkpoints
LLM 可以从简单数据中学习吗?
模型参数量及显存分析
论文阅读:Unlocking Context Constrainits of LLMs:Enhancing Context Efficiency of LLMs with Self-Information-Based Content Filtering
RAG 查询检索模块 - 检索 - 混合检索
解码策略:Speculative Sampling
RAG 查询检索模块 - 前处理 - 查询变换
avatar
clvsit
人生不是戏剧,而我亦非主角
Follow Me
公告
知乎和 CSDN 同名 clvsit,目前在将本地的笔记逐步迁移到这,所以会看到过去日期的文章不断增多