深思考TinyDongni
产品
优势
/ Product Advantages /
技术
参数
/ Technical Parameter /
架构:DongniForCausalLM
隐藏层维度: 1536/768
最大上下文长度: 32K tokens
注意力头数量: 12/14
隐藏层数量:28/24
键值头数量: 2
.RMS标准化: 1e-06
词汇表大小:183542,以支持更多语言和领域的表达
生成
速度
/ Generation speed /

