🤖 AI 与大模型知识体系

从人工智能基础理论到大语言模型前沿进展，系统梳理 AI 发展脉络、核心模型架构、关键技术突破与实用工具资源

主流大语言模型（LLM）

GPT 系列

OpenAI · 2018至今

开创"预训练+微调"范式的先驱。GPT-1（2018）117M参数验证概念，GPT-3（2020）175B参数展示few-shot涌现能力，GPT-4（2023）实现多模态推理。ChatGPT（2022.11）引爆全球AI应用浪潮，至今拥有超2亿周活用户。

Transformer DecoderRLHF多模态Function Calling

Claude 系列

Anthropic · 2023至今

由前OpenAI核心成员创立的Anthropic打造，强调AI安全与"Constitutional AI"对齐方法。Claude 3/4 系列在推理和长上下文上表现突出。Claude Code 是 Anthropic 官方终端式 coding agent，可在终端、IDE 与 GitHub 工作流中使用。

Constitutional AI200K ContextExtended ThinkingMCP 协议

🔵

Gemini 系列

Google DeepMind · 2023至今

Google将DeepMind与Brain团队合并后推出的多模态原生模型。Gemini 1.5 Pro实现百万级token上下文窗口，在长文档理解和视频分析上领先。2024起深度整合至Google全产品（搜索、Workspace、Android）。

多模态原生1M ContextMixture of ExpertsGoogle 生态

🦙

Llama 系列

Meta · 2023至今

Meta推出的开源大模型系列，推动了开源LLM生态爆发。Llama 2（2023.7）首次允许商用，Llama 3.1（2024.7）405B参数比肩闭源模型。开源许可证允许自由微调、部署，催生大量衍生模型（Vicuna、Alpaca等）。

开源405B 参数128K Context商用许可

DeepSeek 系列

深度求索 · 2024至今

DeepSeek V4 Preview 于 2026-04-24 发布，提供 V4-Pro 与 V4-Flash 两条路线：Pro 面向高强度推理与长上下文，Flash 面向低延迟与低成本。官方权重已开源，API 支持非思考、思考与 Think Max 三种模式。

V4 PreviewMoE1M ContextThink Max

🟣

其他重要模型

多家厂商

通义千问（Qwen） — 阿里云，开源多规格模型
文心一言（ERNIE Bot） — 百度，中文生态集成
Mistral — 法国，高效小模型典范
Grok — xAI（Musk），实时数据访问
Cohere Command R+ — 企业级RAG优化

Qwen 开源Mistral MoEGrok 实时

必备资源与工具

官方文档与 API

OpenAI API 文档

platform.openai.com/docs

GPT 系列模型 API 接入文档、Playground、Tokenizer 工具

Anthropic API 文档

docs.anthropic.com

Claude 模型 API、消息格式、工具调用、MCP 协议文档

Google AI Studio 文档

Gemini API 文档、多模态输入、长上下文、Grounding 功能

Hugging Face 文档

huggingface.co/docs

Transformers / Diffusers 库、模型中心、数据集、Spaces 部署

论文与学习资源

arXiv · NLP / CL

arxiv.org/list/cs.CL

计算语言学领域最新论文预印本，LLM 核心论文的首发平台

Papers with Code

paperswithcode.com

论文 + 代码 + 排行榜，快速定位 SOTA 方法和复现代码

Prompt Engineering Guide

promptingguide.ai

系统化的提示工程指南，涵盖 CoT、ReAct、ToT 等高级技术

ML Papers of the Week

github.com/dair-ai

DAIR.AI 精选每周最重要的机器学习论文摘要

实用工具

chat.openai.com

OpenAI 官方对话界面，支持 GPT-4o、DALL·E 3、代码解释器

Anthropic 对话界面，长文档分析强、Projects 功能、Artifacts 交互

github.com/anthropics/claude-code

Anthropic 官方 AI 编程工具，终端驻留式 agent，可在终端、IDE 与 GitHub workflow 中使用

github.com/features/copilot

GitHub + OpenAI 联合推出的 AI 编程助手，支持 VS Code / JetBrains 等

LM Arena（Chatbot Arena）

UC Berkeley 维护的 LLM 匿名对战排行榜，Elo 评分体系

本地运行 LLM 最简方案，一键部署 Llama / Mistral / Qwen 等开源模型

站内专题

AI 历史时间轴

从 1950 年图灵测试到 2025 年大模型时代，人工智能 75 年发展全景。每个里程碑可展开查看详细技术发展脉络。

DeepSeek V4 技术档案

基于 2026-04-24 官方 Preview Release，梳理 V4-Pro/V4-Flash 架构、模型规格、API 路由、Agent 接入与本地部署要点。

Claude Code CLI 架构解析

基于 Anthropic 官方文档和公开仓库，补充 Claude Code 的 agent 循环、工具权限、Hooks、MCP、Subagent 与 SDK 编排核心。

Claude Code Agent/Tool 明细

逐项拆解 Claude Code 官方内置工具、权限、Hook、Subagent、MCP 与可公开说明的提示词入口。

Copilot Chat VS Code 插件架构

基于 microsoft/vscode-copilot-chat 开源仓库和 VS Code AI Extension API，拆解 Chat Participant、Language Model Tool、ToolCallingLoop、Agent Mode 与 MCP 扩展路径。

Copilot Chat 工具源码明细

按源码快照映射 37 个 Language Model Tools、ToolRegistry、ToolsService、AgentPrompt 与 ToolCallingLoop。

Transformer 架构详解

自注意力机制、多头注意力、位置编码、编码器-解码器架构、Flash Attention、MoE 与 Scaling Laws。

GPT 系列演进

从 GPT-1 到 GPT-4：预训练范式诞生、规模效应、涌现能力、RLHF 对齐与多模态，OpenAI 的进化之路。

BERT 与预训练范式

双向掩码预训练、预训练+微调范式、BERT 家族变体（RoBERTa/ELECTRA/DeBERTa），以及与 GPT 路线的历史分野。

RLHF 与对齐技术

RLHF 三阶段流水线、DPO 直接偏好优化、Constitutional AI、奖励模型与对齐的开放挑战。

扩散模型与生成式 AI

从 DDPM 到 Stable Diffusion 到 Sora：扩散原理、Latent Diffusion、DiT、文本图像生成与视频生成前沿。

AI Agent 技术体系

Agent 核心循环、规划与工具使用、Function Calling 与 MCP 协议、多 Agent 协作模式与前沿挑战。