Author avatar

ruanno

DeepSeek-R1:通过强化学习激励大型语言模型的推理能力-01

14
8~11 min

摘要 我们介绍了我们的第一代推理模型 DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习(RL)训练的模型,没有使用监督微调(SFT)作为预训练步骤。通过 RL,DeepSeek-R1-Zero 自然地涌现出许多强大而有趣的推理行

前端利器:使用ExcelJS结合FileSaver轻松实现Excel文件导出

63
3~4 min

为什么选择ExcelJS进行Excel导出? 在当今的数据处理需求中,将数据导出为Excel文件是一种常见的需求。ExcelJS库因其独特的优势,成为了前端开发者的优选工具。 减轻服务器压力 ExcelJS允许在前端生成Excel文件,这意味着数据处理任务从服务器端转移到客户端。这样做不仅减少了服务

第一篇文章

24
0~0 min

hello world