北京大學《DeepSeek內(nèi)部研討系列》(PDF文件)-AI教程攻略

AI教程 2025-04-30

北京大學推出的《DeepSeek內(nèi)部研討系列》主要介紹DeepSeek人工智能模型及應用。《DeepSeek原理與落地應用》闡述DeepSeek模型的原理、發(fā)展歷程和技術(shù)突破,包括在推理能力、多模態(tài)支持和開源特性上的優(yōu)勢。同時展示DeepSeek在教育、學術(shù)、知識付費等多個領(lǐng)域的應用場景,如教學設(shè)計、作業(yè)批改、論文輔助寫作等,強調(diào)低成本、高性能的特點。《DeepSeek 私有化部署和一體機》聚焦DeepSeek的私有化部署,包括個人用戶在本地電腦上的部署方法、企業(yè)級的高性能部署方案,及針對計算資源受限場景的低成本部署策略。同時介紹DeepSeek一體機的配置、性能數(shù)據(jù)及應用場景,為不同用戶提供從模型選型到落地實踐的全場景解決方案。

《DeepSeek原理與落地應用》

《DeepSeek原理與落地應用》是北京大學青鳥人工智能研究院、計算機學院元宇宙技術(shù)研究所和教育學院學習科學實驗室聯(lián)合推出的內(nèi)部手冊。詳細介紹DeepSeek技術(shù)的原理及其在各領(lǐng)域的落地應用。展示DeepSeek在教育領(lǐng)域的廣泛應用,如教學設(shè)計、教學活動、作業(yè)批改、個性化教案、醫(yī)學專業(yè)病理診斷、論文全流程輔助、學術(shù)研究、知識付費和作業(yè)輔導等,提供具體的提示詞示例,幫助用戶更好地基于DeepSeek提升工作效率和學習效果。探討DeepSeek在推理密集型任務(wù)、文檔分析與長上下文理解、開放領(lǐng)域問答與寫作等方面的應用潛力,為AI技術(shù)的普惠化和國產(chǎn)化生態(tài)繁榮提供了有力支持。

DeepSeek Principles and Practical Applications

人工智能概念辨析

  • 大模型相關(guān)術(shù)語:介紹多模態(tài)(文本、圖片、音頻、視頻)、AI工具(如DeepSeek、豆包等)、通用模型(大語言模型、視覺模型等)和行業(yè)模型(教育、醫(yī)療、金融等)的概念。

  • 大模型的前世今生:從人工智能的發(fā)展歷程出發(fā),介紹運算推理、知識工程、機器學習、人工神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、Transformer架構(gòu)、編碼器和解碼器等技術(shù)的發(fā)展脈絡(luò),及生成式人工智能(GenAI)和Diffusion架構(gòu)等內(nèi)容。

  • 大模型的發(fā)展階段:對比生成模型和推理模型的特點,如OpenAI GPT-4o(生成模型)和OpenAI o1(推理模型)在模型定位、推理能力、多模態(tài)支持、應用場景和用戶交互體驗等方面的差異。

  • 生成模型與推理大模型的對比:生成模型適合通用任務(wù)和多模態(tài)交互,推理模型在復雜邏輯和專業(yè)任務(wù)中表現(xiàn)更強,但交互節(jié)奏較慢且多模態(tài)支持有限。

DeepSeek R1

  • 公司背景與發(fā)展歷程:DeepSeek由幻方量化孕育而生,是一家專注于人工智能基礎(chǔ)技術(shù)研究與開發(fā)的創(chuàng)新型科技企業(yè)。介紹DeepSeek的成立背景、投資者背景、市場定位及發(fā)展歷程。

  • DeepSeek模型系列:對比DeepSeek生成模型(V3)和推理模型(R1)的設(shè)計初衷、性能展現(xiàn)、應用范圍。推理模型(R1)在復雜推理任務(wù)中表現(xiàn)出色,如DROP任務(wù)F1分數(shù)達到92.2%,AIME 2024通過率為79.8%。

  • 為什么火:強調(diào)DeepSeek R1的三大優(yōu)勢——開源、低成本、國產(chǎn)化,及其在推理能力上的突破,成為全球大模型賽道的重要領(lǐng)跑者。

  • DeepSeek的算法和算力突破:介紹DeepSeek R1的訓練技術(shù),如混合專家(MOE)、多頭潛在注意力(MLA)、強化學習(GRPO)等,及其對AI行業(yè)的重大影響,包括打破壟斷、價格下調(diào)、推動創(chuàng)新等。

  • 對AI行業(yè)的重大影響:DeepSeek-R1基于低成本和開源特性打破壟斷,降低價格,推動AI行業(yè)創(chuàng)新。

  • 使用方式:介紹DeepSeek的三種使用方式——調(diào)用官方API、模型微調(diào)、直接使用,提供官網(wǎng)、API、手機APP及第三方通道等多種接入方式。

  • 私有化部署:介紹模型的私有化部署方式,包括Ollama部署、vLLM部署等,列舉不同版本的DeepSeek-R1模型及其特點。

模型原理

  • GPT工作原理:詳細介紹GPT的工作原理,包括概率預測、文字接龍、Transformer架構(gòu)、預訓練、監(jiān)督微調(diào)、人類反饋強化學習等環(huán)節(jié),及數(shù)據(jù)來源、模型參數(shù)和上下文窗口大小等內(nèi)容。

  • 生成模型的優(yōu)勢與劣勢:對比生成模型的優(yōu)勢(如語言理解和生成能力、世界知識能力、一定的推理能力)和劣勢(如幻覺、知識庫有限、上下文窗口限制)。

  • 推理模型(DeepSeek-R1)工作原理:介紹DeepSeek R1模型的推理機制,包括思維鏈(Chain of Thought)、蒸餾(Distillation)和強化學習(Reinforcement Learning)等技術(shù),提供相關(guān)論文鏈接。

落地應用

  • DeepSeek的對話能力:強調(diào)DeepSeek讓人類與AI對話更加簡單,基于提示詞技巧提升對話質(zhì)量,適合各層級使用者快速上手。

  • DeepSeek提示詞技巧:列舉多種提示詞技巧,如真誠+直接、通用公式、說人話、反向PUA、善于模仿、擅長銳評、激發(fā)深度思考等,幫助用戶更好地利用DeepSeek進行任務(wù)處理。

    • 真誠 + 直接:明確任務(wù)目標,直接表達需求,避免模糊表述。

    • 通用公式:按“我要(做),要給用,希望達到效果,但擔心問題”的公式組織提示詞,幫助DeepSeek全面理解任務(wù)。


    • 說人話:要求DeepSeek用通俗易懂的語言回答,避免過于專業(yè)或官方的表述。

    • 反向PUA:提出挑戰(zhàn)性問題(如反對理由、批評角度),激發(fā)DeepSeek的深度思考和全面回答。


    • 善于模仿:指定模仿對象或風格,讓DeepSeek生成符合特定風格或語氣的內(nèi)容。

    • 擅長銳評:用特定句式或表達方式(如“笑死”等),激發(fā)DeepSeek的批判性思維和銳評能力。

    • 激發(fā)深度思考:在提示詞中加入“復盤”“批判性思考”等要求,提升回答的深度和質(zhì)量。

  • DeepSeek官方提示詞解讀:介紹DeepSeek官方文檔中的提示詞分類,如代碼類、內(nèi)容分類、結(jié)構(gòu)化輸出、角色扮演、創(chuàng)作類、翻譯類、提示詞生成等,并提供了鏈接。

  • 應用場景:列舉DeepSeek R1的應用場景,包括推理密集型任務(wù)(如編程任務(wù)、數(shù)學問題求解)、教育與知識應用(如教學設(shè)計、教學活動、作業(yè)批改、個性化教案、醫(yī)學專業(yè)病理診斷、論文全流程輔助)、開放領(lǐng)域問答與寫作等。

  • 教育與學術(shù)賦能:詳細介紹DeepSeek在教育領(lǐng)域的應用,如教學設(shè)計、教學活動、作業(yè)批改、個性化教案、醫(yī)學專業(yè)病理診斷、論文全流程輔助、學術(shù)研究、知識付費、作業(yè)輔導等,提供具體的提示詞示例。

    • 教學設(shè)計:設(shè)計課程大綱,明確課程內(nèi)容和設(shè)計思路。

    • 教學活動:設(shè)計變式題、問題支架、課后作業(yè)和分組演練話術(shù)。

    • 作業(yè)批改:為客觀題添加解析,為編程題提供思路。

    • 個性化教案:設(shè)計不同難度習題組,標注難度系數(shù)。

    • 醫(yī)學專業(yè)病理診斷:生成疾病診斷列表,排序、提檢查建議。

    • 論文全流程輔助:輔助選題、大綱生成、文獻綜述、內(nèi)容擴寫、潤色查重。

    • 學術(shù)研究:輔助文獻速讀、參考文獻整理、學術(shù)翻譯、研究方法設(shè)計、數(shù)據(jù)分析報告撰寫。

    • 知識付費:設(shè)計課程大綱、直播腳本、社群運營話術(shù)、付費問答腳本。

    • 作業(yè)輔導:從知識點錨定到能力拓展,設(shè)計輔導流程。

《DeepSeek 私有化部署和一體機》

《DeepSeek 私有化部署和一體機》是北大青鳥人工智能研究院和北大計算機學院元宇宙技術(shù)研究所推出的關(guān)于 DeepSeek 模型部署的指導手冊。詳細介紹 DeepSeek 模型的私有化部署方法,包括個人用戶和企業(yè)級用戶的部署方案。涵蓋從模型選型到具體部署的全過程,提供針對不同硬件環(huán)境和業(yè)務(wù)需求的優(yōu)化建議。重點介紹 DeepSeek 一體機,一種集成高性能硬件和預裝模型的設(shè)備,為企業(yè)和教育機構(gòu)提供開箱即用的 AI 解決方案。提供不同配置的一體機的詳細規(guī)格和性能數(shù)據(jù),幫助企業(yè)根據(jù)自身需求選擇合適的型號。

人工智能與DeepSeek

  • 大模型相關(guān)術(shù)語:介紹多模態(tài)、AI工具(如DeepSeek、豆包等)、通用模型(包括大語言模型、生成模型、推理模型等)以及行業(yè)模型(如教育、醫(yī)療、金融等領(lǐng)域的模型)。

  • 大模型的前世今生:回顧人工智能的發(fā)展歷程,包括運算推理、知識工程、機器學習、人工神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、Transformer架構(gòu)等,及生成式人工智能(GenAI)的興起,列舉國內(nèi)外多種大模型。

  • 大模型的發(fā)展階段:對比生成模型與推理模型的定位、推理能力、多模態(tài)支持、應用場景和用戶交互體驗。

  • 生成模型與推理大模型的對比:生成模型擅長多模態(tài)內(nèi)容生成和通用任務(wù),適合大眾化應用;推理模型在復雜邏輯推理和專業(yè)領(lǐng)域表現(xiàn)出色,適合高精度推理需求。

  • 自2024年起,AI肖睿團隊便接入DeepSeek V2:介紹AI肖睿團隊對DeepSeek技術(shù)體系的研究和應用,包括V2(MoE架構(gòu))、V3(MTP)和R1(推理模型)的演進,及知識蒸餾在各版本中的應用。

  • DeepSeek快速出圈:講述DeepSeek V3和R1模型的發(fā)布及其對行業(yè)的影響,DeepSeek公司和R1模型在2025年春節(jié)后的“出圈”現(xiàn)象。

  • 公司簡介:介紹DeepSeek公司的成立背景、團隊分布、模型系列及與其他中國大模型企業(yè)的關(guān)系。

  • 模型的演進歷史和特點:對比DeepSeek V2、V3和R1三個主要模型的核心架構(gòu)、訓練方法、關(guān)鍵特性和性能表現(xiàn)。

  • DeepSeek模型優(yōu)勢:總結(jié)DeepSeek模型的特點,如開源生態(tài)、模型蒸餾支持、低成本訓練等。

  • DeepSeek模型特點總結(jié):詳細介紹DeepSeek模型的基礎(chǔ)架構(gòu)(如MoE、MLA、RL等)、訓練及框架(如FP8混合精度訓練、TTC等)和社會價值。

  • DeepSeek-R1全家桶:列舉DeepSeek-R1的各個蒸餾模型及其來源和特點。

  • 蒸餾模型-概念:解釋模型蒸餾的定義、原理、優(yōu)勢以及在DeepSeek中的應用。

  • DeepSeek-R1蒸餾模型-能力對比:提供蒸餾模型的選擇經(jīng)驗,包括不同參數(shù)量模型的適用場景和性能表現(xiàn)。

  • DeepSeek模型應用場景:介紹DeepSeek在邊緣計算、復雜數(shù)學與編程任務(wù)、中文場景等領(lǐng)域的應用優(yōu)勢。

  • 使用方式:總結(jié)DeepSeek的多種使用方式,包括直接使用官方服務(wù)、第三方服務(wù)與API調(diào)用、個人部署和企業(yè)部署。

個人部署DeepSeek

  • 模型部署

    • 硬件配置-推薦:提供不同參數(shù)量模型的推薦硬件配置,包括CPU、內(nèi)存、顯存和硬盤空間要求。

    • 硬件配置-最低:提供不同參數(shù)量模型的最低硬件配置要求。

    • 硬件選擇建議:根據(jù)需求、預算和性能平衡,給出了硬件選擇的建議。

    • Ollama功能特點:介紹Ollama工具的特點,如開源免費、簡單易用、模型豐富等。

    • 軟件安裝步驟:詳細說明Ollama客戶端和Docker的安裝方法。

    • 環(huán)境變量配置:解釋Ollama環(huán)境變量的配置方法和建議。

    • 網(wǎng)絡(luò)配置:介紹如何訪問Ollama服務(wù),包括本地部署和遠程部署的網(wǎng)絡(luò)配置注意事項。

  • 環(huán)境準備

    • Ollama常用命令:列舉Ollama的常用命令,如下載模型、運行模型、查看模型信息等。

    • 使用Ollama命令下載模型:介紹下載模型的命令格式、下載過程監(jiān)控和下載失敗處理方法。

    • 使用Ollama命令運行模型:介紹運行模型的命令格式、運行狀態(tài)檢查和停止運行模型的方法。

    • 模型運行效果:展示模型運行后的效果。

    • Ollama常見問題:討論Ollama常見的安全漏洞、未經(jīng)授權(quán)訪問風險以及模型升級后性能退化問題的解決方案。

  • 前端展示

    • 前端展示:介紹PageAssist、Chatbox、OpenWebUI等前端展示工具的特點、適用場景和使用方法。

    • 三款界面總結(jié):對比PageAssist、Chatbox和OpenWebUI的特點和適用場景。

企業(yè)部署DeepSeek

  • Transformers簡介:介紹Transformers庫的功能和特點,包括支持的模態(tài)任務(wù)、框架互操作性等。

  • Transformers部署模型:詳細說明使用Transformers部署DeepSeek模型的步驟,包括安裝依賴包、加載模型、運行模型和其他框架調(diào)用。

  • 生成時常用參數(shù):列舉模型生成時常用的參數(shù)及其含義和注意事項。

  • vLLM簡介:介紹vLLM框架的特點,如PagedAttention技術(shù)、性能提升、與Transformers的無縫集成等。

  • vLLM部署模型:說明使用vLLM部署DeepSeek模型的步驟,包括安裝依賴包、加載并啟動模型。

  • vLLM參數(shù)說明:詳細解釋vLLM啟動命令中的各個參數(shù)及其作用。

  • vLLM實際并發(fā)性能測試:提供vLLM在不同設(shè)備和模型配置下的并發(fā)性能測試數(shù)據(jù)。

  • vLLM常見問題及解決方案:討論vLLM在部署過程中可能遇到的注意力機制兼容性問題及其解決方案。

  • 企業(yè)級70B模型部署案例分享:分享企業(yè)級70B模型部署案例,包括服務(wù)器配置、部署方案和經(jīng)驗總結(jié)。

  • 部署方案簡介:介紹DeepSeek R1滿血版模型的部署方案,包括硬件需求和成本分析。

  • 方案實現(xiàn):詳細說明硬件環(huán)境配置、模型下載和三種低成本部署方案(llama.cpp、KTransformers、Unsloth動態(tài)量化)的實現(xiàn)步驟。

  • 方案一、llama.cpp:介紹llama.cpp項目的背景、安裝步驟、推理步驟和測試結(jié)果。

  • 方案二、KTransformers:介紹KTransformers項目的背景、安裝步驟、運行模型方法和單并發(fā)實測效果。

  • 方案三、Unsloth動態(tài)量化+Ollama:介紹如何基于llama.cpp工具合并Unsloth動態(tài)量化模型的權(quán)重文件,借助Ollama工具進行模型注冊與調(diào)用。

  • 性能測評總結(jié):對比三種低成本部署方案在不同硬件配置下的性能表現(xiàn)。

  • 部署方案總結(jié):對三種低成本部署方案的適用性、優(yōu)勢和局限性進行總結(jié)。

DeepSeek一體機

  • DeepSeek一體機:介紹DeepSeek一體機的概念、優(yōu)勢和適用場景。

  • 國產(chǎn)DeepSeek一體機廠商一覽表:列舉截止至2025年2月的國產(chǎn)DeepSeek一體機廠商及其產(chǎn)品特點。

  • DeepSeek國產(chǎn)一體機671B推薦配置:提供不同配置的DeepSeek一體機的硬件規(guī)格和適用場景。

  • DeepSeek一體機數(shù)據(jù)分享:分享DeepSeek一體機在不同配置下的性能數(shù)據(jù),包括并發(fā)能力和用戶支持數(shù)量。

  • 北大青鳥AI實驗室案例分享:介紹北大青鳥為院校提供的AI實驗室建設(shè)方案,包括DeepSeek一體機的配置和應用場景。

  • 北大青鳥AI實驗室建設(shè)方案:詳細說明AI實驗室建設(shè)方案的系統(tǒng)層、容器層、業(yè)務(wù)層、監(jiān)控層和應用層的特點和功能。

  • 北大青鳥AI實驗室(DeepSeek一體機):分別介紹DeepSeek基礎(chǔ)版、標準版和旗艦版一體機的詳細配置和性能報價。

本文轉(zhuǎn)載自互聯(lián)網(wǎng),如有侵權(quán),聯(lián)系郵箱:478266466@qq.com 刪除