20年前单核老U硬刚现代AI！奔腾4运行Llama 3.2实测：答一题33分钟

倚天百科百科资讯 2026-05-26 15:28:05 14

5月26日消息，据YouTube频道Fully Buffered实测，一颗2006年的Intel奔腾4 641单核处理器成功运行了Meta的Llama 3.2 3B大模型，但回答一个问题需要近33分钟。

测试平台完全采用20年前的主流硬件：奔腾4 641（Cedar Mill核心，3.2GHz，2MB L2 Cache，支持超线程），搭配华硕P5WDH Deluxe主板和4条2GB DDR2-800内存，共计8GB内存。

团队最初尝试了多款主流本地AI模型，但均因CPU不支持AVX2指令集而无法启动，最终发现Llama 3.2支持No-AVX模式，且30亿参数的3B版本刚好能完整载入8GB内存。

实测中，输入问题“What's a Pentium 4？”后，CPU随即满负荷运转，但生成速度也仅为每秒0.21个Token，完成回答耗时约33分钟。

虽然速度慢到令人崩溃，但奔腾4确实跑通了现代大模型推理，当年设计NetBurst架构的工程师恐怕做梦也想不到这一幕。

这个测试的意义不在于实用性，而在于验证了一个极限：在No-AVX模式和足够内存的条件下，20年前的单核处理器也能完成LLM推理。

本文地址： http://www.yitian.cc/43087.html

文章来源：倚天百科