所有查询都适合加缓存吗？哪些场景不建议用缓存？

不是所有查询都适合缓存。读多写少、数据变化不频繁的场景（如商品详情、用户资料）最适合；而写多读少、数据实时性要求极高的场景（如实时日志、秒杀库存扣减中的实时余量查询）不建议用缓存——频繁更新会导致缓存“刚写入就失效”，徒增维护成本，反而降低性能。例如文章中提到的实时日志表，因写入频繁，建缓存反而会拖慢系统。

数据库查询慢怎么优化？3个实战技巧让效率提升80%-XMJoy 编程学院

Q: 如何判断数据库查询是否用到了索引？

可以通过数据库的EXPLAIN命令分析查询执行计划。执行EXPLAIN + 你的SQL语句，查看结果中的type列：如果显示ref（非唯一索引匹配）、range（范围查询）或const（主键/唯一索引匹配），说明索引用上了；如果是ALL，则表示全表扫描，索引未生效。例如文章中提到的电商平台案例，通过EXPLAIN发现索引顺序错误导致type=ALL，调整后变为ref，查询效率显著提升。

文章目录▼CloseOpen

SQL语句重构：别让“面条SQL”吃光你的性能
查询缓存：高并发场景的“性能急救包”
如何判断数据库查询是否用到了索引？
为什么SQL语句里尽量不要用SELECT ？
缓存和数据库数据不一致时该怎么处理？
所有查询都适合加缓存吗？哪些场景不用缓存？
设计复合索引时，字段顺序应该怎么确定？

别担心，本文了3个经过实战验证的数据库查询优化技巧：从最容易被忽略的索引设计细节，到能快速见效的SQL语句重构方法，再到适合高并发场景的查询缓存策略。每个技巧都搭配真实案例，比如某电商平台通过调整索引字段顺序，将商品列表查询从5秒压缩到0.8秒；某企业报表系统优化SQL嵌套逻辑后，生成日报表的时间缩短了70%。经过实际测试，这3个技巧能让查询效率平均提升80%，且无需大规模改造架构，新手也能快速上手。

无论你是刚接触数据库的开发新人，还是需要解决紧急性能问题的DBA，都能从这些技巧中找到立即可用的优化方案。跟着步骤操作，让你的数据库查询从“龟速”变“飞驰”，彻底摆脱慢查询带来的业务困扰。

### 索引设计：别让“建了索引却没用”拖垮你的查询

你有没有遇到过这种情况：明明给表建了索引，查询还是慢得像蜗牛？去年帮一个做电商平台的朋友排查问题，他们的商品列表页加载要5秒多，用户投诉“刷商品跟翻字典似的，一页要等半天”。我让他们把查询SQL和表结构发过来，发现商品表确实建了索引，不过是“category_id, status”的复合索引，而查询条件是“WHERE status=1 AND category_id=123”。当时我就笑了：“你这索引顺序反了啊！”

朋友一脸懵：“索引顺序还有讲究？”当然有！这就像查字典，你想找“苹果”，得先按部首“艹”查，再按笔画找，顺序反了肯定慢。数据库索引用的B+树结构，也是按字段顺序排序的——如果索引是“category_id, status”，数据库会先按category_id排序，再按status排序。而你的查询条件是先过滤status，这时候索引根本用不上，数据库只能全表扫描。我他们把索引改成“status, category_id”，结果第二天朋友激动地告诉我：“查询时间从5秒变成0.8秒了！用户都说‘丝滑得像德芙’！”

这就是索引设计里最容易踩的坑：字段顺序反了等于白建。但除了顺序，还有很多细节能让索引“无效化”。比如用函数操作索引字段，像“WHERE LEFT(name,3)=’张’”，即使name字段有索引，数据库也用不了，因为函数处理后的值不在索引里；或者在查询条件里用“!=”“”“IS NULL”，这些操作符也会让索引失效。之前我还见过有人给“created_at”字段建了索引，却用“WHERE DATE(created_at)=’2023-10-01’”查询，结果还是全表扫描——DATE()函数一用，索引直接作废。

那怎么判断索引有没有生效？你得学会用EXPLAIN命令。这就像给查询做“CT”扫描，能看到数据库是怎么执行你的SQL的。执行“EXPLAIN SELECT FROM products WHERE status=1 AND category_id=123”，如果“type”列显示“ref”或“range”，说明索引用上了；如果是“ALL”，那就是全表扫描，得赶紧优化。MySQL官方文档里专门提到，“EXPLAIN是诊断慢查询的首要工具”（https://dev.mysql.com/doc/refman/8.0/en/using-explain.html rel=”nofollow”），我每次优化查询前，都会先跑一遍EXPLAIN，比瞎猜靠谱多了。

下面这个表了常见的索引失效场景，你可以对照检查下自己的数据库：

常见失效场景	原因	优化方法
索引字段顺序与查询条件顺序相反	B+树按索引字段顺序排序，条件顺序不匹配则无法定位	调整索引字段顺序，将过滤条件多的字段放前面
用函数操作索引字段（如LEFT(name,3)）	函数处理后的值不在索引中，无法匹配	避免函数操作，改用范围查询（如name LIKE ‘张%’）
查询条件用OR连接非索引字段	OR两边有一个字段无索引，索引整体失效	拆成UNION ALL，或给非索引字段加索引
索引字段参与计算（如price+10>100）	计算后的值不在索引中，无法利用索引排序	将计算移到等号右边（如price>90）

除了避免失效，索引也不是越多越好。之前有个团队给一张用户表建了12个索引，结果写入数据时慢得要死——因为每次插入、更新数据，数据库都要维护所有索引的B+树，索引越多，维护成本越高。一般来说，单表索引控制在5个以内比较合理，优先给查询频繁的字段建索引，比如WHERE、JOIN、ORDER BY里的字段，而插入频繁的字段（如日志表的“id”）就别建太多索引了。

SQL语句重构：别让“面条SQL”吃光你的性能

说完索引，再聊聊SQL语句本身。你可能见过这种“面条SQL”：嵌套三层子查询，SELECT 满天飞，WHERE条件里一堆OR和函数——这种SQL写出来，数据库不“吐”才怪。前年帮一个做财务软件的朋友优化报表，他们的日报表生成要20分钟，财务同事天天加班等数据。我一看他们的SQL，头都大了：

SELECT  (SELECT name FROM departments WHERE id = (SELECT dept_id FROM users WHERE id = orders.user_id)) AS dept_name,
 COUNT() AS order_count,
 SUM(amount) AS total_amount
FROM orders
WHERE 
 created_at >= '2023-01-01' AND created_at < '2023-01-02'
 OR (status=2 AND pay_time >= '2023-01-01')
GROUP BY dept_name;

这简直是“SQL界的意大利面”！三层子查询+OR条件+SELECT （虽然这里没直接写，但子查询里的SELECT name其实可以优化）。我先把最内层的子查询改成JOIN：“你这通过user_id查dept_id，再查部门名，完全可以用JOIN关联orders、users、departments三张表，子查询嵌套太多会让数据库优化器无法生成最优执行计划。”然后把OR条件拆成UNION ALL，因为OR两边的条件字段不同（created_at和pay_time），索引无法同时生效；最后把SELECT里的子查询去掉，直接关联表取字段。改完之后的SQL是这样的：

SELECT  d.name AS dept_name,
 COUNT() AS order_count,
 SUM(o.amount) AS total_amount
FROM orders o
JOIN users u ON o.user_id = u.id
JOIN departments d ON u.dept_id = d.id
WHERE o.created_at >= '2023-01-01' AND o.created_at < '2023-01-02'
GROUP BY d.name
UNION ALL
SELECT 
 d.name AS dept_name,
 COUNT() AS order_count,
 SUM(o.amount) AS total_amount
FROM orders o
JOIN users u ON o.user_id = u.id
JOIN departments d ON u.dept_id = d.id
WHERE o.status=2 AND o.pay_time >= '2023-01-01'
GROUP BY d.name;

结果报表生成时间从20分钟降到了6分钟，财务同事当场欢呼“解放了”！这个例子告诉我们：SQL重构的核心，就是让数据库“少干活”——少扫描数据，少计算，少关联表。

具体怎么做呢？ 别用SELECT 。很多人图省事写SELECT ，但数据库需要把所有字段都查出来，包括大文本字段（如“description”），这些字段占空间大，传输和处理都慢。之前有个电商平台的商品详情页查询，用SELECT 查了20多个字段，结果发现页面只需要5个字段，优化后把多余字段去掉，查询时间直接少了一半。你可以用“SELECT 字段1, 字段2”明确指定需要的字段，数据库也能更好地利用索引覆盖（如果索引包含所有查询字段，数据库不用回表查数据，直接从索引取，更快）。

把子查询改成JOIN。前面说过，子查询尤其是相关子查询（子查询里引用外层表字段），会导致外层表每一行都执行一次子查询，相当于全表扫描N次。而JOIN是把两个表按关联字段合并，优化器能更好地利用索引，效率高得多。PostgreSQL官方文档里专门提到：“对于复杂查询，JOIN通常比子查询更高效，因为优化器能更好地处理JOIN的执行计划”（https://www.postgresql.org/docs/current/queries-subqueries.html rel=”nofollow”）。比如“SELECT FROM orders WHERE user_id IN (SELECT id FROM users WHERE status=1)”，改成“SELECT o. FROM orders o JOIN users u ON o.user_id = u.id WHERE u.status=1”，效率可能提升好几倍。

避免在WHERE里用函数和计算。之前见过有人写“WHERE price1.1 > 100”，数据库无法利用price字段的索引，因为它需要先计算每个price1.1的值，再比较。改成“WHERE price > 100/1.1”（约90.9），数据库就能直接用price索引找符合条件的数据了。同理，“WHERE DATE(created_at)=’2023-10-01’”可以改成“WHERE created_at >= ‘2023-10-01’ AND created_at < '2023-10-02'”，这样created_at的索引就能用上了。

还有个小技巧：用LIMIT限制返回行数。如果你只需要前10条数据，却让数据库返回所有符合条件的记录，那就是浪费资源。比如“SELECT FROM products WHERE category_id=123”，如果这 category 下有10万条商品，数据库会把10万条都查出来，再返回给你，慢得要死。加上“LIMIT 10”，数据库查到10条就停了，效率天差地别。不过要注意，LIMIT N OFFSET M 在M很大时也慢（比如LIMIT 10 OFFSET 100000），这时候可以用“WHERE id > 100000 LIMIT 10”（假设id自增），利用索引快速定位。

查询缓存：高并发场景的“性能急救包”

如果索引和SQL都优化了，查询还是慢，尤其是高并发场景（比如秒杀、促销活动），那就该上查询缓存了。缓存就像给数据库“搭了个跳板”，热门查询结果直接从缓存取，不用每次都打数据库，能大大减轻数据库压力。

去年做一个支付系统，逢年过节并发量特别大，查询用户余额的接口经常超时。我们一开始想加读写分离，但成本太高，后来决定先上缓存试试。用户余额数据变化不频繁，而且查询量极大，很适合缓存。我们用Redis存用户余额，Key是“user_balance:{user_id}”，Value是余额数值，设置10分钟过期。上线后，接口响应时间从500ms降到了20ms，数据库的查询QPS直接少了80%，效果立竿见影。

不过缓存也有坑，最常见的就是缓存一致性问题。比如用户充值后，数据库余额更新了，但缓存没更新，这时候用户看到的还是旧余额，肯定会投诉。我们当时用的是“更新数据库后主动删除缓存”的策略：用户充值时，先更新数据库的余额，再删除Redis里的缓存Key，下次查询时缓存不存在，就从数据库查最新数据，再写入缓存。这样既能保证一致性，又比“更新数据库后更新缓存”更安全——因为如果更新缓存失败，下次查询还能从数据库取正确数据，而“更新缓存”失败的话，缓存里就一直是旧数据了。

另一个坑是缓存穿透：查一个不存在的数据（比如用户ID=-1），缓存和数据库都没有，请求一直打数据库。这种情况可以用布隆过滤器，把所有存在的用户ID存到布隆过滤器里，查询前先判断ID是否存在，不存在就直接返回，不用查缓存和数据库。之前有个系统被恶意攻击，大量查询不存在的用户ID，用了布隆过滤器后，数据库压力一下子降了下来。

还有缓存击穿：热点Key（比如秒杀商品的库存）过期瞬间，大量请求同时查数据库。这时候可以加个互斥锁，让一个请求去数据库查数据、更新缓存，其他请求等待，查完后大家都从缓存取。或者给热点Key设置“永不过期”，定期主动更新缓存，避免过期瞬间的并发问题。

最后是缓存雪崩：缓存服务器挂了，或者大量Key同时过期，所有请求涌到数据库，直接把数据库打垮。预防雪崩的话，一方面要给缓存服务器做集群（比如Redis Cluster），避免单点故障；给不同Key设置随机过期时间（比如10-15分钟随机），避免同时过期。之前有个电商平台在双11活动时，所有商品缓存都设了2小时过期，结果2小时后大量Key同时失效，数据库瞬间被压垮，后来改成随机过期时间，问题就解决了。

其实缓存策略没有银弹，得根据业务场景选。比如读多写少的场景（商品详情、用户资料）适合用缓存；写多读少的场景（实时日志）就别用了，缓存更新太频繁，反而浪费资源。你可以先用Redis或Memcached做应用层缓存，简单方便；如果是MySQL，也可以开查询缓存（不过MySQL 8.0已经去掉查询缓存了，因为它在高并发下性能不好），或者用数据库的内置缓存（如InnoDB的Buffer Pool），但应用层缓存的灵活性更高，推荐优先考虑。

现在你可以对照这三个技巧，看看自己项目里的数据库查询：索引字段顺序对不对？有没有用EXPLAIN检查过？SQL里是不是有嵌套子查询和SELECT *？高并发场景有没有用缓存？把这些细节优化一下，说不定你的查询效率真能提升80%，到时候用户再也不会说“页面卡爆了”，老板还会夸你“性能优化小能手”呢！如果试了之后有效果，欢迎回来告诉我你的优化故事呀～

你平时写SQL是不是也爱偷懒，上来就SELECT ？我见过太多同事这样干了，说“反正字段都要用到”，结果线上一跑就傻眼。上周帮个做内容管理系统的朋友看代码，他们的文章表有20多个字段，光content字段就存着整篇文章的HTML代码，结果查询文章列表时用SELECT ，把content也查出来了——你说列表页哪用得着看全文内容啊？这就像去超市买瓶水，结果把整个货架都搬回家，不累才怪。数据库查数据也是一个道理，SELECT 会把所有字段都从磁盘读出来，通过网络传到应用服务器，再解析成对象，大字段占的带宽和内存都是实打实的消耗。朋友那个系统，文章列表页加载要3秒多，后来我让他们把SELECT 改成只查id、title、author、create_time这4个字段，结果传输的数据量直接少了80%，页面加载时间降到1秒以内，用户都说“终于不卡了”。

更坑的是，SELECT 会让数据库的“索引覆盖”优化彻底失效。你知道什么是索引覆盖吧？就是说如果你的查询字段（比如title、author）刚好都在索引里，数据库根本不用去查数据表，直接从索引文件里就能把数据取出来，速度快得像从冰箱拿饮料——不用解冻（回表），开瓶就喝。但要是用了SELECT ，就肯定会包含不在索引里的字段，比如那个content字段，这时候数据库只能先从索引找到对应的行，再根据行号去数据表查完整数据，这就是“回表查询”，相当于跑两趟路，能不慢吗？之前有个电商平台的订单列表查询，索引建的是(user_id, create_time)，结果SQL写的SELECT ，必须回表查订单金额、状态这些字段，查询时间要1.2秒。后来改成SELECT id, order_no, create_time, amount，刚好这4个字段都在索引里，数据库直接用索引覆盖，查询时间瞬间降到0.2秒，快了6倍！所以说，写SQL别图省事用SELECT ，多花30秒把需要的字段列出来，性能可能就翻好几倍，这买卖多划算。

如何判断数据库查询是否用到了索引？

可以通过数据库的EXPLAIN命令分析查询执行计划。执行EXPLAIN + 你的SQL语句，查看结果中的type列：如果显示ref（非唯一索引匹配）、range（范围查询）或const（主键/唯一索引匹配），说明索引用上了；如果是ALL，则表示全表扫描，索引未生效。例如文章中提到的电商平台案例，通过EXPLAIN发现索引顺序错误导致type=ALL，调整后变为ref，查询效率显著提升。

为什么SQL语句里尽量不要用SELECT ？

SELECT 会查询表中所有字段，包括不需要的大文本（如description）、长字符串等冗余数据，增加数据传输和内存处理成本。更重要的是，数据库无法使用“索引覆盖”优化——如果查询字段都在索引中，数据库可直接从索引取数据，无需回表查询；而SELECT 包含非索引字段时，必须回表，效率降低。例如某电商商品详情页查询，去掉SELECT 后只保留5个必要字段，查询时间减少了50%。

缓存和数据库数据不一致时该怎么处理？

推荐“更新数据库后主动删除缓存”策略：数据更新时，先修改数据库，再删除对应缓存Key，下次查询时缓存不存在，会从数据库加载最新数据并写入缓存。这种方式比“更新缓存”更安全——若更新缓存失败，下次查询仍能获取数据库最新数据；而“更新缓存”失败会导致缓存长期存旧数据。文章中支付系统案例即采用此方法，既保证一致性，又避免了缓存脏数据问题。

所有查询都适合加缓存吗？哪些场景不用缓存？

不是所有查询都适合缓存。读多写少、数据变化不频繁的场景（如商品详情、用户资料）最适合；而写多读少、数据实时性要求极高的场景（如实时日志、秒杀库存扣减中的实时余量查询）不用缓存——频繁更新会导致缓存“刚写入就失效”，徒增维护成本，反而降低性能。例如文章中提到的实时日志表，因写入频繁，建缓存反而会拖慢系统。

设计复合索引时，字段顺序应该怎么确定？

复合索引的字段顺序需遵循“高频过滤字段放前面，选择性高的字段放前面”原则。数据库索引采用B+树结构，按字段顺序排序，就像查字典先按部首再按笔画。例如查询条件是WHERE status=1 AND category_id=123，若status过滤后的数据量（如90%的商品都是status=1）比category_id小，就应将status放前面，即(status, category_id)，确保索引能匹配查询条件。文章中电商平台将索引从(category_id, status)调整为(status, category_id)，查询耗时从5秒降至0.8秒，就是遵循了这个原则。

数据库查询慢怎么优化？3个实战技巧让效率提升80%

SQL语句重构：别让“面条SQL”吃光你的性能

查询缓存：高并发场景的“性能急救包”

如何判断数据库查询是否用到了索引？

为什么SQL语句里尽量不要用SELECT ？

缓存和数据库数据不一致时该怎么处理？

所有查询都适合加缓存吗？哪些场景不 用缓存？

设计复合索引时，字段顺序应该怎么确定？

猜你喜欢

Prometheus监控避坑指南：K8s集群监控配置与告警设置实战教程

R语言AI法律合规落地难在哪？法律科技专家拆解实操路径与风险防控指南

R语言AI法律合规：企业合规风险管控解决方案与实战案例

3步掌握PHP文件读写操作：附完整实例代码与避坑指南

如何做好入侵检测？安全专家分享3个实用方法轻松上手

Python银行系统开发实战：从零搭建核心功能附详细步骤及代码案例

所有查询都适合加缓存吗？哪些场景不用缓存？