📅 人工智能发展时间轴

从 1950 年图灵测试到 2025 年大模型时代,75 年关键里程碑。点击节点查看详情。

🏛 奠基时代 1950—1969 概念诞生与早期探索
1950

图灵测试

Alan Turing

Alan Turing 发表 "Computing Machinery and Intelligence",提出"机器能思考吗?"及著名的图灵测试:如果机器在对话中让人类无法区分它是否为机器,则可认为它具有智能。

这篇论文还预言了机器学习、遗传算法、强化学习等方向。Turing 被后世尊为"人工智能之父"。

1956

达特茅斯会议

McCarthy et al.

John McCarthy、Marvin Minsky、Claude Shannon 等在达特茅斯学院召开为期两个月的研讨会。会议提案首次使用 "Artificial Intelligence" 一词,标志着 AI 作为独立学科的正式诞生。

与会者包含了此后数十年 AI 研究的几乎所有奠基人。McCarthy 发明了 Lisp 语言,Minsky 创建了 MIT AI 实验室。

1957

感知机 Perceptron

Frank Rosenblatt

Frank Rosenblatt 提出感知机(Perceptron)——第一个可通过数据学习的人工神经网络。它能学习简单的线性分类任务。

虽然感知机只能解决线性可分问题(后被 Minsky 严厉批评),但它奠定了神经网络从理论到实践的基础。

1966

ELIZA 聊天机器人

Weizenbaum, MIT

MIT 的 ELIZA 是最早的自然语言处理程序之一,通过模式匹配和替换规则模拟心理治疗师的对话。许多用户相信它真的"理解"了他们——这个现象后来被称为 ELIZA 效应

讽刺的是,ELIZA 的创造者 Weizenbaum 后来成为 AI 批评者——他不安于人们如此轻易地将感情投射到一个简单的程序上。

1969

Perceptrons 批判

Minsky & Papert

Minsky 和 Papert 出版《Perceptrons》,数学证明单层感知机无法解决 XOR 等非线性问题。这本书被广泛(误)解读为"神经网络没用",导致研究资金锐减,直接引发了第一次 AI 寒冬。

事实上,Minsky 并未否定多层网络的可能性,但当时缺乏有效的多层网络训练方法——这要等到 1986 年反向传播的普及。

❄️ 寒冬与复苏 1970—1985 资金紧缩与专家系统兴起
1974

第一次 AI 寒冬

1974—1980

英国 Lighthill 报告(1973)严厉批评 AI 研究未兑现承诺,英美政府大幅削减 AI 资金。60 年代的乐观预言落空,AI 进入第一个寒冬期。

这段时期的教训是:过度承诺和期望管理失败会导致整个领域的信任崩溃。AI 的"炒作-幻灭"周期从此开始反复。

1980

专家系统 Expert Systems

MYCIN, R1/XCON

专家系统将人类专家的知识编码为 if-then 规则,在医疗诊断(MYCIN)、化学分析(DENDRAL)、计算机配置(R1/XCON)等领域取得商业成功。DEC 的 R1 系统每年节省 4000 万美元。

日本启动"第五代计算机"计划(5.5 亿美元),引发全球 AI 军备竞赛。但专家系统的知识获取瓶颈最终限制了其发展。

🔗 连接主义复兴 1986—1999 神经网络回归与统计学习
1986

反向传播算法

Rumelhart, Hinton, Williams

Rumelhart、Hinton 和 Williams 在 Nature 发表 "Learning representations by back-propagating errors",证明反向传播可以有效训练多层神经网络。

虽然反向传播的数学基础此前已被多人独立发现(Werbos 1974, LeCun 1985),但这篇论文首次系统展示了其在复杂任务上的有效性,引发了神经网络研究的第二次浪潮。

1989

CNN 与 LeNet

Yann LeCun

Yann LeCun 提出 LeNet-5——第一个实用的卷积神经网络(CNN),用于手写数字识别。LeNet 被 AT&T 部署用于美国银行支票的自动读取系统。

CNN 的核心思想——局部感受野、权重共享、池化——至今仍是计算机视觉的基石。

1997

Deep Blue 击败卡斯帕罗夫

IBM

IBM 的 Deep Blue 在六局比赛中以 3.5:2.5 击败国际象棋世界冠军 Garry Kasparov,人类历史上首次有计算机在正式比赛中击败在任世界冠军。

Deep Blue 使用专用硬件芯片,每秒评估 2 亿个棋局位置。Kasparov 赛后质疑 IBM 作弊,这段公案至今仍有争议。

1997

LSTM 长短期记忆

Hochreiter & Schmidhuber

Hochreiter 和 Schmidhuber 提出 LSTM(Long Short-Term Memory),通过门控机制解决了 RNN 的梯度消失问题。

LSTM 后来成为序列建模的主力架构,广泛应用于机器翻译、语音识别、文本生成等领域,直到 2017 年 Transformer 出现才被逐步替代。

🚀 深度学习爆发 2006—2016 GPU、大数据与深度神经网络
2006

深度学习复兴

Geoffrey Hinton

Geoffrey Hinton 发表 "A fast learning algorithm for deep belief nets",证明可以通过逐层预训练有效训练深层网络。"Deep Learning" 一词开始流行。

三个关键因素推动复兴:① 大规模数据集(ImageNet 1400万标注图像)② GPU 并行计算 ③ 新的训练技巧(ReLU、Dropout、Batch Norm)

2011

IBM Watson 赢得 Jeopardy!

IBM

IBM Watson 在美国知识竞赛节目 Jeopardy! 中击败人类冠军 Ken Jennings 和 Brad Rutter。Watson 使用 NLP + 信息检索 + 知识图谱的混合方法,能理解自然语言问题并从海量文档中提取答案。

2012

AlexNet 赢得 ImageNet

Krizhevsky, Sutskever, Hinton

AlexNet 在 ImageNet 挑战赛中以 Top-5 错误率 15.3%(第二名 26.2%)大幅获胜。这是深度学习的"iPhone 时刻"。

2012 AlexNet — 8层,GPU 训练,ReLU 激活
2014 VGGNet — 19层,3×3小卷积堆叠
2014 GoogLeNet — 22层,Inception 模块
2015 ResNet — 152层,残差连接解决深层退化

Krizhevsky、Sutskever(后联合创立 OpenAI)、Hinton 三人的工作开启了深度学习在工业界的全面采用。

2014

GAN 生成对抗网络

Ian Goodfellow

Ian Goodfellow 提出 GAN:生成器与判别器对抗训练,学习数据分布并生成逼真样本。

2014 原始 GAN — 概念验证
2015 DCGAN — 卷积架构,稳定训练
2017 WGAN — Wasserstein 距离,解决模式坍塌
2018 StyleGAN — NVIDIA,高清人脸生成
2020 StyleGAN2 — 几乎无法辨别真伪

Yann LeCun 称 GAN 是"过去十年机器学习最有趣的想法"。

2014

Seq2Seq 序列到序列

Sutskever, Vinyals, Le

Ilya Sutskever 等提出 Sequence to Sequence 框架:编码器将输入编码为固定向量,解码器从中生成输出。奠定了神经机器翻译基础。

2015 年 Bahdanau 等引入注意力机制(Attention)——这一思想成为后来 Transformer 的核心。

2016

AlphaGo 击败李世乭

Google DeepMind

DeepMind 的 AlphaGo 以 4:1 击败世界围棋冠军李世乭。围棋搜索空间约 10^170,暴力搜索不可行。

2016.3 AlphaGo Lee — 策略网络 + 价值网络 + MCTS
2017.5 AlphaGo Master — 60:0 横扫顶尖棋手
2017.10 AlphaGo Zero — 完全自我对弈,3天超越所有前代
2018 AlphaZero — 泛化至国际象棋和将棋

AlphaGo 系列深刻影响了强化学习、搜索算法和自我博弈训练范式的发展。

⚡ Transformer 时代 2017—2021 注意力机制革命与预训练范式
2017

Transformer

Vaswani et al., Google

Google 论文 "Attention Is All You Need" 提出 Transformer 架构,完全摒弃 RNN/CNN,仅用自注意力机制。

核心创新:多头自注意力 + 位置编码 + 编码器-解码器结构。Transformer 成为此后几乎所有 NLP 突破的基础。8 位作者中 7 位后来离开 Google 创业。

→ 查看 Transformer 架构详解

2018

GPT-1

OpenAI, Radford et al.

OpenAI 发表 GPT——使用 Transformer Decoder 进行大规模无监督预训练,然后在下游任务微调。GPT-1 仅 117M 参数,但在 9 个 NLP 基准中 8 个取得当时最佳,验证了"预训练+微调"范式的巨大潜力。

→ 查看 GPT 系列完整演进

2018

BERT

Devlin et al., Google

Google 发表 BERT(Bidirectional Encoder Representations from Transformers),使用 Transformer Encoder + 双向掩码语言模型预训练。在 11 个 NLP 任务上刷新 SOTA,确立了预训练范式。

→ 查看 BERT 与预训练范式详解

2019

GPT-2 "太危险不能发布"

OpenAI, 1.5B

OpenAI 发布 GPT-2(1.5B 参数),以"可能被用于生成假新闻"为由延迟开放完整模型——AI 领域首次因安全考虑限制模型发布,引发关于 AI 开放与安全的广泛讨论。

2020

GPT-3 · 涌现能力

OpenAI, 175B

GPT-3(175B 参数,96层 Transformer)展示了令人震惊的 few-shot 涌现能力——无需微调,仅通过提示即可执行翻译、问答、代码生成等任务。

论文 "Language Models are Few-Shot Learners" 成为 LLM 领域最重要的里程碑之一,开启了 LLM 商业化时代。

2021

DALL·E / Codex / Copilot

OpenAI

2021 年 OpenAI 密集发布多个突破性应用:

2021.1 DALL·E — 文本生成图像
2021.7 Codex — 代码生成模型(Copilot 底层)
2021.10 GitHub Copilot 技术预览版,AI 辅助编程时代开启

→ 查看扩散模型与生成式 AI 详解

🤖 大模型时代 2022—2025 ChatGPT 引爆、开源生态与 AI Agent
2022

ChatGPT 发布

OpenAI, GPT-3.5

OpenAI 发布 ChatGPT(GPT-3.5 + RLHF),5天破100万用户,2个月破1亿——史上增长最快的消费级应用。

核心创新在 RLHF(基于人类反馈的强化学习)对齐技术。ChatGPT 引爆全球 AI 热潮,"百模大战"在中国展开。

→ 查看 RLHF 与对齐技术详解

2023.3

GPT-4 · 多模态推理

OpenAI

GPT-4 首个大规模多模态模型(文本+图像输入)。在 GRE、律师资格考试等达到人类前 10% 水平。架构细节未公开(传闻 8×220B MoE),推理、编程、数学能力全面碾压 GPT-3.5。

2023.7

Llama 2 开源

Meta

Meta 开源 Llama 2(7B/13B/70B),首次允许商业使用,引爆开源 LLM 生态。

2023.2 Llama 1 — 仅限研究
2023.7 Llama 2 — 商用许可
2024.4 Llama 3 — 多语言,大幅提升
2024.7 Llama 3.1 405B — 开源最强,比肩闭源 SOTA

Llama 系列催生了数百个衍生模型,奠定了开源 LLM 生态的基础。

2023.12

Gemini 发布

Google DeepMind

Google DeepMind 发布 Gemini(Ultra/Pro/Nano),多模态原生设计。Gemini 1.5 Pro 实现 1M token 上下文窗口,可处理整本书籍或数小时视频。

2024.2

Sora · 视频生成模型

OpenAI

OpenAI 公布 Sora 视频生成模型,能根据文本提示生成最长 60 秒的高质量视频,展示了对物理世界理解的初步能力。使用 Diffusion Transformer(DiT)架构。

2024.3

Claude 3 系列

Anthropic

Anthropic 发布 Claude 3(Opus/Sonnet/Haiku),Opus 在多个基准上超越 GPT-4 Turbo。核心特色:Constitutional AI、200K 上下文、低幻觉率。2024 年底推出 Claude 3.5 Sonnet(Extended Thinking)。

2024.11

MCP 协议发布

Anthropic

Anthropic 发布 Model Context Protocol(MCP)——AI 模型与外部工具/数据源交互的开放标准协议。被视为"AI 应用的 USB 标准"。

→ 查看 AI Agent 技术体系

2025.1

DeepSeek-R1 开源

深度求索

深度求索开源 DeepSeek-R1,数学/代码推理逼近 o1-preview。训练成本仅约 557 万美元,展示了算法效率可替代算力堆叠。MIT 开源许可推动中国开源 LLM 生态。

2025.5

Claude Code 开源

Anthropic, 113K+ Stars

Anthropic 将 Claude Code 开源至 GitHub,首周即获 113K+ Stars。它是终端驻留的 agentic 编程工具,核心架构:系统提示词引擎、分层权限模型、15+ 工具链、流式 Agent 循环、上下文管理系统。

→ 查看完整架构解析(15章深度剖析)

数据来源:各机构官方论文、博客及公开资料