AVX指令集

高级向量扩展指令集（英语：Advanced Vector Extensions，简称AVX）是x86架构微处理器中的指令集，由英特尔在2008年3月提出，并在2011年第一季度发布的Sandy Bridge系列处理器中首次支持^[1]。AMD在随后的2011年第三季度发布的Bulldozer系列处理器中开始支持AVX^[2]。AVX指令集提供了新的特性、指令和编码方案。

AVX是X86指令集的SSE延伸架构，如IA16至IA32般的把寄存器XMM 128bit提升至YMM 256bit，以增加一倍的运算效率。此架构支持了三运算指令（3-Operand Instructions），减少在编码上需要先复制才能运算的动作。在微码部分使用了LES LDS这两少用的指令作为延伸指令Prefix。^{[查证请求]}

AVX2指令集将大多数整数命令操作扩展到256位，并引入了熔合乘法累积（FMA）运算。AVX-512则使用新的EVEX前缀（英语：EVEX prefix）编码将AVX指令进一步扩展到512位。Intel Xeon Scalable处理器支持AVX-512。

支持

CPU对AVX指令集的支持情况

英特尔
- Sandy Bridge（2011年Q1）及更新的的处理器（除赛扬和奔腾）均支持^[3]
- Tiger Lake（2020年Q3）及更新的的奔腾和赛扬处理器均支持^[4]
AMD:
- 推土机微架构（2011年Q4）及更新的处理器均支持^[5]

威盛电子
- Nano QuadCore
- Eden X4
兆芯:
- 基于五道口架构的处理器（KX-5000及KH-20000）^[6]^[7]

编译器和汇编器对AVX指令集的支持情况

Absoft（英语：Absoft）编译器支持-mavx选项
Free Pascal编译器从2.7.1版本开始为AVX和AVX2提供-CfAVX和-CfAVX2选项
Delphi从RAD studio v11.0 Alexandria版本开始支持AVX2和AVX512^[8]
GNU汇编器从GNU Binutils 2.19版本开始支持AVX^[9]
4.6版本的GCC和11.1版本的Intel编译器包开始支持AVX
Open64编译器从4.5.1版本开始使用-mavx标志支持AVX
PathScale编译器支持-mavx选项
Vector Pascal（英语：Vector Pascal）编译器通过-cpuAVX32选项支持AVX
Visual Studio 2010/2012 编译器通过内联函数（intrinsic）和 /arch:AVX选项支持AVX
NASM从2.03版本开始支持 AVX，并在 2.04 版本中，进行了许多与 AVX 相关的错误修复和更新^[10]

操作系统对AVX指令集的支持情况

AVX通过256 位宽的YMM寄存器添加了新的寄存器状态，因此需要操作系统显式支持，以在上下文切换时正确保存和恢复AVX的扩展寄存器。以下操作系统版本支持 AVX：

DragonFly BSD：在2013年初添加支持
FreeBSD：在2012年1月21日提交的补丁中添加支持，^[11]该补丁包含在9.1稳定版中^[12]
Linux：内核版本2.6.30（发布于2009年6月9日^[13]）开始支持^[14]
macOS：从10.6.8版本（Snow Leopard，发布于2011年6月23日）开始支持。^[15]macOS Ventura 不支持没有AVX2指令集的 x86 处理器^[16]
OpenBSD：在2015年3月21日添加支持^[17]
Solaris：在 Solaris 10 Update 10 和 Solaris 11 中开始支持。
Windows：在 Windows 7 SP1（KB976932）、Windows Server 2008 R2 SP1、^[18]Windows 8、Windows 10 中提供支持
- Windows Server 2008 R2 SP1 结合 Hyper-V 需要热修复（KB2568088）以支持 AMD AVX（Opteron 6200 和 4200 系列）处理器
- Windows XP 和 Windows Server 2003 在内核驱动和用户应用程序中都不支持 AVX

参见

参考资料

^ Kanter, David. Intel's Sandy Bridge Microarchitecture. www.realworldtech.com. September 25, 2010 [February 17, 2018]. （原始内容存档于2019-08-16）（美国英语）.
^ Hruska, Joel. Analyzing Bulldozer: Why AMD's chip is so disappointing - Page 4 of 5 - ExtremeTech. ExtremeTech. October 24, 2011 [February 17, 2018]. （原始内容存档于2019-08-16）（美国英语）.
^ Intel Offers Peek at Nehalem and Larrabee. ExtremeTech. March 17, 2008.
^ Intel® Celeron® 6305 Processor (4M Cache, 1.80 GHz, with IPU) Product Specifications. ark.intel.com. [2020-11-10] （英语）.
^ Butler, Michael; Barnes, Leslie; Das Sarma, Debjit; Gelinas, Bob. Bulldozer: An Approach to Multithreaded Compute Performance (PDF). IEEE Micro. March–April 2011, 31 (2): 6–15. S2CID 28236214. doi:10.1109/MM.2011.23. （原始内容 (PDF)存档于May 19, 2024）.
^ 开胜® KH-20000系列处理器 - 兆芯. www.zhaoxin.com. [2024-10-31].
^ 开先® KX-5000系列处理器 - 兆芯. www.zhaoxin.com. [2024-10-31].
^ What's New - RAD Studio. docwiki.embarcadero.com. [2021-09-17].
^ GAS Changes. sourceware.org. [2024-05-03].
^ NASM - The Netwide Assembler, Appendix C: NASM Version History. nasm.us. [2024-05-03].
^ Add support for the extended FPU states on amd64, both for native 64bit and 32bit ABIs, svnweb.freebsd.org, January 21, 2012 [January 22, 2012]
^ FreeBSD 9.1-RELEASE Announcement. [May 20, 2013].
^ Linux 2.6.30 - Linux Kernel Newbies, [July 13, 2009]
^ x86: add linux kernel support for YMM state, [July 13, 2009]
^ Twitter, [June 23, 2010]
^ Devs are making progress getting macOS Ventura to run on unsupported, decade-old Macs. August 23, 2022.
^ Add support for saving/restoring FPU state using the XSAVE/XRSTOR., [March 25, 2015]
^ Floating-Point Support for 64-Bit Drivers, [December 6, 2009]

外部链接

Intel Intrinsics Guide（页面存档备份，存于互联网档案馆）

[1] Kanter, David. Intel's Sandy Bridge Microarchitecture. www.realworldtech.com. September 25, 2010 [February 17, 2018]. （原始内容存档于2019-08-16）（美国英语）.

[2] Hruska, Joel. Analyzing Bulldozer: Why AMD's chip is so disappointing - Page 4 of 5 - ExtremeTech. ExtremeTech. October 24, 2011 [February 17, 2018]. （原始内容存档于2019-08-16）（美国英语）.

[fh09g-3] Intel Offers Peek at Nehalem and Larrabee. ExtremeTech. March 17, 2008.

[9r8b9-4] Intel® Celeron® 6305 Processor (4M Cache, 1.80 GHz, with IPU) Product Specifications. ark.intel.com. [2020-11-10] （英语）.

[5] Butler, Michael; Barnes, Leslie; Das Sarma, Debjit; Gelinas, Bob. Bulldozer: An Approach to Multithreaded Compute Performance (PDF). IEEE Micro. March–April 2011, 31 (2): 6–15. S2CID 28236214. doi:10.1109/MM.2011.23. （原始内容 (PDF)存档于May 19, 2024）.

[6] 开胜® KH-20000系列处理器 - 兆芯. www.zhaoxin.com. [2024-10-31].

[7] 开先® KX-5000系列处理器 - 兆芯. www.zhaoxin.com. [2024-10-31].

[8] What's New - RAD Studio. docwiki.embarcadero.com. [2021-09-17].

[gas-version-history-9] GAS Changes. sourceware.org. [2024-05-03].

[nasm-version-history-10] NASM - The Netwide Assembler, Appendix C: NASM Version History. nasm.us. [2024-05-03].

[lSP7Y-11] Add support for the extended FPU states on amd64, both for native 64bit and 32bit ABIs, svnweb.freebsd.org, January 21, 2012 [January 22, 2012]

[HIQRm-12] FreeBSD 9.1-RELEASE Announcement. [May 20, 2013].

[XB18C-13] Linux 2.6.30 - Linux Kernel Newbies, [July 13, 2009]

[etOsK-14] x86: add linux kernel support for YMM state, [July 13, 2009]

[3qGKK-15] Twitter, [June 23, 2010]

[16] Devs are making progress getting macOS Ventura to run on unsupported, decade-old Macs. August 23, 2022.

[K5BEr-17] Add support for saving/restoring FPU state using the XSAVE/XRSTOR., [March 25, 2015]

[2kEEK-18] Floating-Point Support for 64-Bit Drivers, [December 6, 2009]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]