廈門大學《大模型概念、技術與應用實踐》(PPT文件)-AI教程攻略

AI教程 2025-04-30

《大模型概念、技術與應用實踐》由廈門大學大數據教學團隊制作,科普大模型技術及其在各領域的應用。強調其在大數據教學領域的影響力。回顧人工智能發展簡史,引出大模型的定義、特點和分類,詳細闡述了在自然語言處理、計算機視覺語音識別等領域的廣泛應用,以及對工作和生活的深遠影響。介紹了AIGC(人工智能生成內容)技術,包括文本、圖片、語音、視頻生成及輔助編程等應用實踐案例,展示了大模型在內容創作、智能辦公、AI搜索等方面的強大能力。是一份全面、深入且通俗易懂的大模型科普資料,適合對人工智能和大模型技術感興趣的讀者學習和參考。


廈門大學大數據教學團隊介紹

廈門大學大數據教學團隊是國內高校大數據教學的重要貢獻者,團隊以林子雨副教授為核心,成員平均年齡46歲以下,結構合理,涵蓋教學型、科研型和實驗工程師。團隊自2013年起專注于大數據教學,具有前瞻性和強大的執行力,在教材編寫、MOOC課程、師資培養等方面取得了顯著成就。

林子雨是廈門大學計算機科學與技術系副教授,以第一作者編著出版了15本大數據系列教材,被國內1000余所高校采用。曾獲得多項教學成果獎,入選多個國家級教學項目,被授予“教育部國家智慧教育公共服務平臺應用典型案例”等榮譽。他的個人主頁提供了豐富的教學資源和聯系方式。

林子雨編著的《數字素養通識教程——大數據與人工智能時代的計算機通識教育》是面向大一新生的教材,旨在重構大學計算機公共課知識體系,培養學生計算思維、數據思維和AI思維。教材官網提供了講義PPT、MOOC視頻、案例視頻、上機實驗、教學大綱等豐富資源,供師生使用。

人工智能發展簡史

人工智能的發展歷程可以追溯到1950年圖靈測試的提出。1956年,達特茅斯會議標志著人工智能學科的正式誕生。此后,人工智能經歷了萌芽期(1950-2005)、沉淀期(2006-2019)和爆發期(2020-至今)。從早期的CNN到Transformer架構,再到GPT系列和多模態大模型的出現,人工智能技術不斷演進,推動了自然語言處理、計算機視覺等領域的快速發展。

人工智能思維

人工智能思維強調對人工智能運行模式的理解,包括:
  • 了解:掌握AI的基礎原理。
  • 區分:明確人類能力和機器能力的差異。
  • 協作:學會與AI系統協同工作,提升效率。
這種思維模式有助于人們更好地適應數字化時代的需求。

大模型:人工智能的前沿

  • 大模型的概念

    • 大模型是基于深度學習技術的超大規模人工智能模型,具有海量參數、強大的學習能力和泛化能力。其“大”的特點體現在參數數量龐大、訓練數據量大和計算資源需求高。例如,GPT-3參數規模達1750億,而GPT-4的參數規模超過1.8萬億。

  • 大模型的發展歷程:大模型的發展經歷了三個階段:

    • 萌芽期(1950-2005):以CNN為代表的神經網絡模型。

    • 沉淀期(2006-2019):以Transformer架構為代表的模型。

    • 爆發期(2020-至今):以GPT系列為代表的預訓練大模型。

  • 人工智能與大模型的關系

    • 大模型是人工智能領域的前沿技術,屬于預訓練模型的一種。它通過大規模數據訓練,具備強大的語言生成、邏輯推理和多模態處理能力,是推動AI技術發展的關鍵力量。

  • 大模型產品:國內外主要的大模型產品,包括:

    • 國外產品:如OpenAI的ChatGPT、Gemini,以及Sora等。

    • 國內產品:如DeepSeek、通義千問、豆包、文心一言等。

    • 這些產品在自然語言處理、多模態理解和生成等領域表現出色,廣泛應用于智能客服、內容創作、代碼生成等場景。

  • 大模型原理

    • 大模型基于Transformer架構,通過編碼器-解碼器結構和自注意力機制,能夠處理和生成自然語言文本。其核心能力在于捕捉單詞之間的復雜關系,實現高效的文本生成和理解。

  • 大模型特點:大模型具有以下特點:

    • 巨大規模:參數數量龐大,模型體積大。

    • 涌現能力:在大規模數據訓練下展現出復雜能力。

    • 多任務學習:能夠處理多種任務,具備泛化能力。

    • 大數據訓練:需要海量數據支持。

    • 強大計算資源:依賴GPU/TPU等硬件加速。

    • 遷移學習和預訓練:通過預訓練和微調適應不同任務。

  • 大模型分類

    • 大模型按照應用領域可分為L0、L1、L2三個層級,覆蓋自然語言處理、計算機視覺、語音識別等多個領域。

  • 大模型應用領域:大模型在多個領域有廣泛應用,包括但不限于:

    • 自然語言處理:文本生成、翻譯、問答系統等。

    • 計算機視覺:圖像分類、目標檢測、醫學影像分析等。

    • 語音識別:語音合成、語音翻譯等。

    • 推薦系統:個性化推薦、廣告投放等。

    • 醫療健康:輔助診斷、藥物研發等。

    • 金融風控:風險評估、欺詐檢測等。

  • 大模型對工作和生活的影響:大模型對工作和生活產生了深遠影響:

    • 工作:提高了工作效率,推動了自動化辦公和智能客服的發展。

    • 生活:改變了內容消費方式,提供了個性化服務。

  • 本地部署大模型

    • 介紹了本地部署大模型的優勢,包括數據隱私保護、避免使用限制、定制化靈活性、成本優化和離線高效使用。以Ollama和DeepSeek R1為例,展示了本地部署的具體方法。

  • 基于大模型的智能體

    • 基于大模型的智能體能夠模擬人類智能行為,具備自主性和交互性。例如,OpenAI的Operator和Deep Research能夠完成復雜任務,提供高效、個性化的服務。

AIGC應用與實踐

  • AIGC概述

    • AIGC(人工智能生成內容)是利用AI技術生成文本、圖像、音頻、視頻等內容的新方式。它基于生成對抗網絡(GAN)、預訓練模型等技術,能夠根據用戶輸入生成高質量內容,廣泛應用于創意設計、教育、娛樂等領域。

  • 文本類AIGC應用實踐

    • 介紹了文本生成工具(如DeepSeek、文心一言)的使用方法和技巧。這些工具能夠根據用戶提示生成文章、詩歌、代碼等,并支持多輪對話和文檔處理功能。

  • 圖片類AIGC應用實踐

    • 圖片類AIGC利用深度學習生成圖像,應用場景包括圖像生成、修復、風格轉換等。以百度文心一格為例,展示了如何通過輸入提示詞生成高質量圖片。

  • 語音類AIGC應用實踐

    • 語音類AIGC能夠實現語音識別、語音合成和情感分析等功能,廣泛應用于智能語音助手和客服領域。以豆包和訊飛智作為例,展示了語音類AIGC的使用方法。

  • 視頻類AIGC應用實踐

    • 視頻類AIGC能夠根據文本或圖像生成視頻內容,應用場景包括廣告制作、影視特效等。以騰訊智影為例,展示了如何生成數字人播報視頻。

  • AIGC在輔助編程中的應用

    • AIGC能夠自動生成代碼,提高編程效率。以豆包為例,展示了如何通過AI生成Python代碼。

  • AI搜索

    • AI搜索利用自然語言處理和機器學習技術,提供更精準的搜索結果。以360的納米AI搜索為例,展示了其多模態搜索和智能工具集成的特點。

  • AI智能辦公

    • AI智能辦公通過文檔處理、數據分析和智能助手等功能,提升辦公效率。例如,AI能夠生成文檔初稿、自動排版、總結文檔內容和輔助數據分析。


本文轉載自互聯網,如有侵權,聯系郵箱:478266466@qq.com 刪除