count(*)、count(1)、count(column) 的区别

在 SQL 中，COUNT(*)、COUNT(1) 和 COUNT(column) 是用于统计行数的聚合函数，但它们之间存在细微的区别。以下是它们的详细对比：

定义：统计表中所有行的数量，包括所有列。
特点：
- 不会忽略任何列中的 NULL 值。
- 统计的是整个表中的所有行，无论是否有 NULL 值。
性能：
- 在某些数据库系统（如 MySQL）中，COUNT(*) 的性能可能略低于 COUNT(1) 或 COUNT(column)，因为它需要扫描所有列来确认行的存在。
- 在其他数据库系统（如 PostgreSQL 或 SQL Server）中，COUNT(*) 和 COUNT(1) 的性能基本相同。

示例：

SELECT COUNT(*) AS total_rows
FROM employees;

定义：统计表中所有行的数量，将每一行视为一个常量值 1。
特点：
- 等价于 COUNT(<任意非 NULL 常量>)，例如 COUNT('x') 或 COUNT(42)。
- 不会忽略任何行，即使某列包含 NULL 值。
性能：
- 在某些数据库系统中，COUNT(1) 的性能比 COUNT(*) 更优，因为它不需要检查所有列，只需生成一个虚拟的常量值即可。
- 在现代数据库优化器中，COUNT(1) 和 COUNT(*) 的性能差异通常可以忽略不计。

示例：

SELECT COUNT(1) AS total_rows
FROM employees;

示例：

SELECT COUNT(salary) AS non_null_salaries
FROM employees;

特性	`COUNT(*)`	`COUNT(1)`	`COUNT(column)`
统计范围	所有行	所有行	指定列中非 `NULL` 值的行
是否忽略 `NULL`	否	否	是
性能	可能稍慢（视数据库而定）	通常与 `COUNT(*)` 相同	取决于列中 `NULL` 值的比例
适用场景	统计表中所有行数	统计表中所有行数	统计某一列中非 `NULL` 值的行数

索引的影响：如果查询的列上有索引，COUNT(column) 的性能可能会优于 COUNT(*) 或 COUNT(1)，因为数据库可以直接利用索引来统计非 NULL 值的行数。
NULL 值处理：COUNT(column) 会忽略 NULL 值，因此在统计时需明确是否需要考虑 NULL 值。

通过理解它们的区别和适用场景，可以选择最合适的函数来满足具体的业务需求并优化查询性能。