20年前单核老U硬刚现代AI!奔腾4运行Llama 3.2实测:答一题33分钟

倚天百科 百科资讯 1

5月26日消息,据YouTube频道Fully Buffered实测,一颗2006年的Intel奔腾4 641单核处理器成功运行了Meta的Llama 3.2 3B大模型,但回答一个问题需要近33分钟。

测试平台完全采用20年前的主流硬件:奔腾4 641(Cedar Mill核心,3.2GHz,2MB L2 Cache,支持超线程),搭配华硕P5WDH Deluxe主板和4条2GB DDR2-800内存,共计8GB内存。

团队最初尝试了多款主流本地AI模型,但均因CPU不支持AVX2指令集而无法启动,最终发现Llama 3.2支持No-AVX模式,且30亿参数的3B版本刚好能完整载入8GB内存。

实测中,输入问题“What's a Pentium 4?”后,CPU随即满负荷运转,但生成速度也仅为每秒0.21个Token,完成回答耗时约33分钟。

虽然速度慢到令人崩溃,但奔腾4确实跑通了现代大模型推理,当年设计NetBurst架构的工程师恐怕做梦也想不到这一幕。

这个测试的意义不在于实用性,而在于验证了一个极限:在No-AVX模式和足够内存的条件下,20年前的单核处理器也能完成LLM推理。