📅 人工智能发展时间轴
从 1950 年图灵测试到 2025 年大模型时代,75 年关键里程碑。点击节点查看详情。
图灵测试
Alan Turing 发表 "Computing Machinery and Intelligence",提出"机器能思考吗?"及著名的图灵测试:如果机器在对话中让人类无法区分它是否为机器,则可认为它具有智能。
这篇论文还预言了机器学习、遗传算法、强化学习等方向。Turing 被后世尊为"人工智能之父"。
达特茅斯会议
John McCarthy、Marvin Minsky、Claude Shannon 等在达特茅斯学院召开为期两个月的研讨会。会议提案首次使用 "Artificial Intelligence" 一词,标志着 AI 作为独立学科的正式诞生。
与会者包含了此后数十年 AI 研究的几乎所有奠基人。McCarthy 发明了 Lisp 语言,Minsky 创建了 MIT AI 实验室。
感知机 Perceptron
Frank Rosenblatt 提出感知机(Perceptron)——第一个可通过数据学习的人工神经网络。它能学习简单的线性分类任务。
虽然感知机只能解决线性可分问题(后被 Minsky 严厉批评),但它奠定了神经网络从理论到实践的基础。
ELIZA 聊天机器人
MIT 的 ELIZA 是最早的自然语言处理程序之一,通过模式匹配和替换规则模拟心理治疗师的对话。许多用户相信它真的"理解"了他们——这个现象后来被称为 ELIZA 效应。
讽刺的是,ELIZA 的创造者 Weizenbaum 后来成为 AI 批评者——他不安于人们如此轻易地将感情投射到一个简单的程序上。
Perceptrons 批判
Minsky 和 Papert 出版《Perceptrons》,数学证明单层感知机无法解决 XOR 等非线性问题。这本书被广泛(误)解读为"神经网络没用",导致研究资金锐减,直接引发了第一次 AI 寒冬。
事实上,Minsky 并未否定多层网络的可能性,但当时缺乏有效的多层网络训练方法——这要等到 1986 年反向传播的普及。
第一次 AI 寒冬
英国 Lighthill 报告(1973)严厉批评 AI 研究未兑现承诺,英美政府大幅削减 AI 资金。60 年代的乐观预言落空,AI 进入第一个寒冬期。
这段时期的教训是:过度承诺和期望管理失败会导致整个领域的信任崩溃。AI 的"炒作-幻灭"周期从此开始反复。
专家系统 Expert Systems
专家系统将人类专家的知识编码为 if-then 规则,在医疗诊断(MYCIN)、化学分析(DENDRAL)、计算机配置(R1/XCON)等领域取得商业成功。DEC 的 R1 系统每年节省 4000 万美元。
日本启动"第五代计算机"计划(5.5 亿美元),引发全球 AI 军备竞赛。但专家系统的知识获取瓶颈最终限制了其发展。
反向传播算法
Rumelhart、Hinton 和 Williams 在 Nature 发表 "Learning representations by back-propagating errors",证明反向传播可以有效训练多层神经网络。
虽然反向传播的数学基础此前已被多人独立发现(Werbos 1974, LeCun 1985),但这篇论文首次系统展示了其在复杂任务上的有效性,引发了神经网络研究的第二次浪潮。
CNN 与 LeNet
Yann LeCun 提出 LeNet-5——第一个实用的卷积神经网络(CNN),用于手写数字识别。LeNet 被 AT&T 部署用于美国银行支票的自动读取系统。
CNN 的核心思想——局部感受野、权重共享、池化——至今仍是计算机视觉的基石。
Deep Blue 击败卡斯帕罗夫
IBM 的 Deep Blue 在六局比赛中以 3.5:2.5 击败国际象棋世界冠军 Garry Kasparov,人类历史上首次有计算机在正式比赛中击败在任世界冠军。
Deep Blue 使用专用硬件芯片,每秒评估 2 亿个棋局位置。Kasparov 赛后质疑 IBM 作弊,这段公案至今仍有争议。
LSTM 长短期记忆
Hochreiter 和 Schmidhuber 提出 LSTM(Long Short-Term Memory),通过门控机制解决了 RNN 的梯度消失问题。
LSTM 后来成为序列建模的主力架构,广泛应用于机器翻译、语音识别、文本生成等领域,直到 2017 年 Transformer 出现才被逐步替代。
深度学习复兴
Geoffrey Hinton 发表 "A fast learning algorithm for deep belief nets",证明可以通过逐层预训练有效训练深层网络。"Deep Learning" 一词开始流行。
三个关键因素推动复兴:① 大规模数据集(ImageNet 1400万标注图像)② GPU 并行计算 ③ 新的训练技巧(ReLU、Dropout、Batch Norm)
IBM Watson 赢得 Jeopardy!
IBM Watson 在美国知识竞赛节目 Jeopardy! 中击败人类冠军 Ken Jennings 和 Brad Rutter。Watson 使用 NLP + 信息检索 + 知识图谱的混合方法,能理解自然语言问题并从海量文档中提取答案。
AlexNet 赢得 ImageNet
AlexNet 在 ImageNet 挑战赛中以 Top-5 错误率 15.3%(第二名 26.2%)大幅获胜。这是深度学习的"iPhone 时刻"。
Krizhevsky、Sutskever(后联合创立 OpenAI)、Hinton 三人的工作开启了深度学习在工业界的全面采用。
GAN 生成对抗网络
Ian Goodfellow 提出 GAN:生成器与判别器对抗训练,学习数据分布并生成逼真样本。
Yann LeCun 称 GAN 是"过去十年机器学习最有趣的想法"。
Seq2Seq 序列到序列
Ilya Sutskever 等提出 Sequence to Sequence 框架:编码器将输入编码为固定向量,解码器从中生成输出。奠定了神经机器翻译基础。
2015 年 Bahdanau 等引入注意力机制(Attention)——这一思想成为后来 Transformer 的核心。
AlphaGo 击败李世乭
DeepMind 的 AlphaGo 以 4:1 击败世界围棋冠军李世乭。围棋搜索空间约 10^170,暴力搜索不可行。
AlphaGo 系列深刻影响了强化学习、搜索算法和自我博弈训练范式的发展。
Transformer
Google 论文 "Attention Is All You Need" 提出 Transformer 架构,完全摒弃 RNN/CNN,仅用自注意力机制。
核心创新:多头自注意力 + 位置编码 + 编码器-解码器结构。Transformer 成为此后几乎所有 NLP 突破的基础。8 位作者中 7 位后来离开 Google 创业。
GPT-1
OpenAI 发表 GPT——使用 Transformer Decoder 进行大规模无监督预训练,然后在下游任务微调。GPT-1 仅 117M 参数,但在 9 个 NLP 基准中 8 个取得当时最佳,验证了"预训练+微调"范式的巨大潜力。
BERT
Google 发表 BERT(Bidirectional Encoder Representations from Transformers),使用 Transformer Encoder + 双向掩码语言模型预训练。在 11 个 NLP 任务上刷新 SOTA,确立了预训练范式。
GPT-2 "太危险不能发布"
OpenAI 发布 GPT-2(1.5B 参数),以"可能被用于生成假新闻"为由延迟开放完整模型——AI 领域首次因安全考虑限制模型发布,引发关于 AI 开放与安全的广泛讨论。
GPT-3 · 涌现能力
GPT-3(175B 参数,96层 Transformer)展示了令人震惊的 few-shot 涌现能力——无需微调,仅通过提示即可执行翻译、问答、代码生成等任务。
论文 "Language Models are Few-Shot Learners" 成为 LLM 领域最重要的里程碑之一,开启了 LLM 商业化时代。
DALL·E / Codex / Copilot
2021 年 OpenAI 密集发布多个突破性应用:
ChatGPT 发布
OpenAI 发布 ChatGPT(GPT-3.5 + RLHF),5天破100万用户,2个月破1亿——史上增长最快的消费级应用。
核心创新在 RLHF(基于人类反馈的强化学习)对齐技术。ChatGPT 引爆全球 AI 热潮,"百模大战"在中国展开。
GPT-4 · 多模态推理
GPT-4 首个大规模多模态模型(文本+图像输入)。在 GRE、律师资格考试等达到人类前 10% 水平。架构细节未公开(传闻 8×220B MoE),推理、编程、数学能力全面碾压 GPT-3.5。
Llama 2 开源
Meta 开源 Llama 2(7B/13B/70B),首次允许商业使用,引爆开源 LLM 生态。
Llama 系列催生了数百个衍生模型,奠定了开源 LLM 生态的基础。
Gemini 发布
Google DeepMind 发布 Gemini(Ultra/Pro/Nano),多模态原生设计。Gemini 1.5 Pro 实现 1M token 上下文窗口,可处理整本书籍或数小时视频。
Sora · 视频生成模型
OpenAI 公布 Sora 视频生成模型,能根据文本提示生成最长 60 秒的高质量视频,展示了对物理世界理解的初步能力。使用 Diffusion Transformer(DiT)架构。
Claude 3 系列
Anthropic 发布 Claude 3(Opus/Sonnet/Haiku),Opus 在多个基准上超越 GPT-4 Turbo。核心特色:Constitutional AI、200K 上下文、低幻觉率。2024 年底推出 Claude 3.5 Sonnet(Extended Thinking)。
MCP 协议发布
Anthropic 发布 Model Context Protocol(MCP)——AI 模型与外部工具/数据源交互的开放标准协议。被视为"AI 应用的 USB 标准"。
DeepSeek-R1 开源
深度求索开源 DeepSeek-R1,数学/代码推理逼近 o1-preview。训练成本仅约 557 万美元,展示了算法效率可替代算力堆叠。MIT 开源许可推动中国开源 LLM 生态。
Claude Code 开源
Anthropic 将 Claude Code 开源至 GitHub,首周即获 113K+ Stars。它是终端驻留的 agentic 编程工具,核心架构:系统提示词引擎、分层权限模型、15+ 工具链、流式 Agent 循环、上下文管理系统。
数据来源:各机构官方论文、博客及公开资料