关注微信公众号查券更方便
大模型算法:强化学习、微调与对齐(全彩)详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践
动手学强化学习(上交大ACM班俞勇团队作品,chatgpt背后理论剖析)图灵奖得主John Hopcroft推荐的强化学习入门书 deepseek机器学习(异步图书出品)
深度强化学习 DeepSeek-R1强化学习算法基础 图解强化学习(图灵出品)
深度学习入门4:强化学习 DeepSeek强化学习算法基础(图灵出品)
动手学机器学习 deepseek机器学习(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
大规模语言模型:从理论到实践(第2版)详解LLM 预训练 指令微调 SFT 强化学习MoE 多模态 智能体 RAG 大模型效率优化DeepSeek推理模型 评估
深度学习入门全套:Python理论+框架+NLP+强化学习 京东套装4册(图灵出品) deepseek教程
Easy RL 强化学习教程(easyrl蘑菇书带你了解chatgpt背后的技术) deepseek机器学习(异步图书出品)
【正版包邮】机器学习方法 第2版(1-4) 4册 清华大学出版社 李航 著 无监督学习 监督学习 深度学习 强化学习
动手学自然语言处理 deepseek 自然语言(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
强化学习(第2版)(博文视点出品) 2024年图灵奖得主作品 必知ChatGPT背后的技术,DeepSeek核心基础,强化学习领域奠基性经典著作!
扩散模型——核心原理与强化学习优化 强化学习 生成模型 人工智能 轨迹优化 价值函数 多任务泛化 异步图书出品
概率机器学习 基础篇 概率机器学习 强化学习 概率模型 决策理论 信息论 优化理论
深度强化学习算法原理与实战:基于MATLAB
深度强化学习实战(异步图书出品) deepseek教程
强化学习与随机优化
强化学习——从原理到实践 李福林 清华大学出版社 强化学习 时序差分 策略梯度
深度强化学习图解deepseek教程
Joy RL:强化学习实践教程 异步图书出品
Easy RL 强化学习教程(easyrl蘑菇书) 强化机器学习深度学习实
大模型算法:强化学习、微调与对齐(全彩)
深度学习实战:基于 TensorFlow 2.X 的计算机视觉开发应用 DeepSeek聊天机器人动手学python深度学习人工智能机器学习强化学习神经网络linux入门书籍教材智能风控
Apache Spark 深度学习实战 chatgpt聊天机器人动手学强化学习机器学习人工智能丛书 大数据处理框架k8s云计算云原生数据中台数据安全spark流处理 deepseek教程图书书香节
深度强化学习(王树森、黎彧君联合导师北大张志华作品)(图灵出品)
强化学习 前沿算法与应用 白辰甲 值函数值分布建模等基础算法 人工智能科学与技术丛书 机器学习 深度学习
MCP极简入门 曹洪伟 MCP RAG Agent ChatGPT DeepSeek 大模型 多模态 智能体 机器学习 强化学习 人工智能技术书籍
强化学习 原理与Python实战 肖智清 智能系统与技术丛书自然语言处理深度学习入门与实战基于python人工智能神经网络与深度学习书籍
【京仓直发】PyTorch深度学习模型开发实战 chatgpt聊天机器人动手学机器学习方法人工智能知识图谱强化学习自然语言处理pytorch神经网络ai入门书籍教材 deepseek教程
强化学习与随机优化:序贯决策的通用框架 清华大学出版社 [美] 沃伦·B. 鲍威尔(Warren B. Powell)著 郭涛 译 著 书籍 图书
强化学习基础、原理与应用