掌握Python安全编码规范：告别常见漏洞，提升代码安全性-XMJoy 编程学院

文章目录▼CloseOpen

从漏洞根源学规范：你写的代码可能正在”裸奔”
把规范变成习惯：安全编码的落地三板斧

从漏洞根源学规范：你写的代码可能正在”裸奔”

咱们先从最常见的漏洞说起，你可能觉得”安全漏洞”离自己很远，但我敢打赌，你或多或少写过类似这样的代码。就拿SQL注入来说，前阵子我接手一个老项目，看到数据库查询是这么写的：

# 危险写法：直接拼接用户输入
username = request.args.get('username')
sql = f"SELECT  FROM users WHERE username = '{username}'"
cursor.execute(sql)

当时我后背一凉——如果有人输入' OR '1'='1，这条SQL就变成了SELECT FROM users WHERE username = '' OR '1'='1'，直接把所有用户信息都查出来了！后来问之前的开发者，他说”用户输入都是内部员工用，应该没事”——这其实是最大的误区：安全漏洞从来不是”应该没事”，而是”只要有可能性就会被利用”。

对应的安全规范其实很简单：永远用参数化查询代替字符串拼接。正确的写法应该是这样：

# 安全写法：参数化查询
username = request.args.get('username')
用%s或?作为占位符，不同数据库驱动语法可能不同
cursor.execute("SELECT  FROM users WHERE username = %s", (username,))

为什么参数化查询能防注入？因为数据库会把SQL语句和参数分开解析，不管参数里有什么特殊字符，都会被当成普通字符串处理，不会被当作SQL命令执行。这就像你给朋友写信，把内容装在信封里，邮局只会传递信封，不会拆开执行里面的”命令”。

除了SQL注入，XSS（跨站脚本攻击）也是Web开发的重灾区。我见过最夸张的案例是一个博客系统，直接把用户评论原样输出到页面：

# 危险写法：直接输出用户输入
comment = request.form.get('comment')
return f"
{comment}
"

结果有人在评论里写了alert(document.cookie)，其他用户点开评论区就会弹出自己的Cookie信息——如果是管理员登录状态，黑客就能用Cookie冒充管理员操作。正确的做法是对用户输入进行HTML转义，把特殊字符（比如<转成<）变成浏览器不会执行的文本：

# 安全写法：使用html.escape转义输出
from html import escape
comment = request.form.get('comment')
return f"
{escape(comment)}
"

这里有个小技巧，我自己写模板时会养成”三不原则”：不确定是否安全的输入不直接输出、HTML标签不手写拼接、第三方内容必须过过滤函数。你可以试试在代码里搜f"和{，看看有没有直接拼接用户输入的地方，这些都是潜在的XSS风险点。

为了让你更清晰地对应漏洞和规范，我整理了一个表格，这些是我在10多个项目审计中的高频问题，你可以对照着检查自己的代码：

漏洞类型	危险代码示例	安全代码示例	核心规范
SQL注入	cursor.execute(f”SELECT FROM users WHERE id={user_id}”)	cursor.execute(“SELECT FROM users WHERE id=%s”, (user_id,))	使用参数化查询，禁止字符串拼接SQL
XSS攻击	return render_template(“page.html”, content=user_input)	return render_template(“page.html”, content=escape(user_input))	用户输入输出HTML前必须转义
路径遍历	with open(f”/data/{filename}”, “r”) as f: …	safe_path = os.path.join(“/data”, filename) if not safe_path.startswith(“/data/”): raise Error	限制文件操作路径在指定目录内
权限越界	if user.is_login: allow_access()	if user.has_permission(“view_data”) and user.id == data.owner_id: allow_access()	权限检查需同时验证角色和资源归属

这些漏洞其实都有一个共同点：信任了不可信的输入。OWASP（开放Web应用安全项目）每年发布的Top 10安全风险报告里，注入、失效的访问控制这些问题常年霸榜（你可以去OWASP官网{rel=”nofollow”}看看最新报告）。我常跟团队说：”写代码时要把所有用户输入都当成’有毒’的，必须经过’消毒’才能用”——这个”消毒”的过程，就是安全编码规范的核心。

把规范变成习惯：安全编码的落地三板斧

知道规范是一回事，实际写代码时能想起来用才是关键。我见过不少开发者，安全文档看得明明白白，但写代码时一赶进度就全忘了。分享三个我亲测有效的落地方法，帮你把规范变成肌肉记忆。

第一板斧：用工具当”安全保镖”，让漏洞无处遁形

你可能会说：”我哪记得住那么多规范？”别担心，我们有自动化工具帮忙。推荐你试试Bandit——这是Python官方推荐的静态代码分析工具，专门找代码里的安全问题。我在团队里推广Bandit半年后，代码里的高危漏洞数量直接降了60%。

怎么用呢？先通过pip安装：pip install bandit，然后在项目根目录运行bandit -r ./src，它会扫描所有.py文件，像个”安全侦探”一样找出问题。比如你用了os.popen(user_input)，它会立刻警告” subprocess call with shell=True identified, security issue”；如果你在Flask里用request.values.get获取参数后直接拼接SQL，它也会标红提醒。

我之前有个习惯，喜欢用pickle.load(open("data.pkl", "rb"))反序列化数据，觉得方便。结果Bandit扫描后报了个高危：”Pickle deserialization can execute arbitrary code”。后来查资料才知道，pickle反序列化时会执行数据里的代码，如果data.pkl被篡改，黑客就能远程执行命令——这个坑我现在想起来还后怕。后来改用了json序列化，虽然麻烦点，但安全多了。

除了Bandit，你还可以在IDE里装插件，比如VS Code的”Python Security”插件，写代码时实时提醒。我把这些工具集成到了Git提交钩子（pre-commit）里，现在团队里谁提交代码前不跑Bandit，提交就会失败——刚开始大家有点烦，但后来发现省了很多线上修复漏洞的时间，反而都觉得值了。

第二板斧：培养”安全三问”，写代码前先过脑子

工具是辅助，真正的安全意识要靠自己。我了”安全三问”，每次写关键代码前都会在心里过一遍，你也可以试试：

第一问：这个输入从哪来？能完全信任吗？

比如用户表单、URL参数、Cookie、甚至第三方API返回的数据，都属于”不可信输入”。我之前对接一个物流API，默认相信了对方返回的”user_id”字段，直接用它查数据库，结果后来发现对方API有漏洞，返回的user_id能被篡改——还好发现及时，不然就造成数据越权了。现在我对所有外部输入，不管来源多”正规”，都会重新校验格式和权限。

第二问：这个输出要去哪？需要做什么处理？

如果输出到HTML页面，必须用html.escape；输出到JSON，要确保没有敏感信息（比如密码、Token）；输出到日志，别把用户身份证号、手机号直接写进去。我见过一个项目日志里全是用户完整手机号，后来被监管部门查到，罚款不说，还影响了用户信任——其实用手机号[:3] + '' + 手机号[-4:]这种脱敏处理就能避免。

第三问：这个操作的权限，最小需要多少？

写数据库操作时，别用root账号，专门建个只有select、insert权限的用户；调用系统命令时，能用subprocess.run(args, shell=False)就别开shell=True；服务器上跑Python进程，用普通用户而不是root。我之前在Linux服务器上用root跑Flask应用，结果一个路径遍历漏洞直接让黑客删了系统文件——血的教训啊！

第三板斧：让安全融入团队协作，而不是个人单打独斗

安全从来不是一个人的事，尤其是在团队开发中。我之前待过一个10人小团队，因为没有统一的安全规范，每个人写代码都按自己的习惯来：有人用requests.get不验证SSL证书（verify=False），有人把JWT密钥硬编码在代码里，还有人在测试环境用生产数据库——结果测试服务器被入侵，连带生产数据也泄露了。

后来我们做了三件事，效果很明显：

制定”安全编码 checklist”：把前面说的漏洞类型、检查要点做成表格，code review时必须对照打勾。比如检查数据库操作是否用了参数化查询，敏感配置是否存在环境变量里，而不是代码中。

每月一次”漏洞复盘会”：找一个真实的安全事件（比如最近某大厂的Python漏洞），大家一起分析原因，讨论如果是我们的项目会怎么防范。这种”情景模拟”比干讲规范记得牢多了。

新人培训第一堂课讲安全：我发现很多安全问题出在新人身上，不是他们不重视，而是没人教。现在我们新人入职第一天，就带他们用Bandit扫描一个有故意埋坑的Demo项目，让他们亲手找出SQL注入、XSS这些漏洞——印象特别深刻。
你可能会觉得这些流程麻烦，但想想线上漏洞爆发时的手忙脚乱，前期多花10%的时间做安全，后期能省90%的麻烦。我现在的团队，因为这些措施，已经连续18个月没出现过线上安全漏洞，客户满意度反而提高了——毕竟谁不喜欢用安全可靠的产品呢？

其实安全编码就像开车系安全带，刚开始觉得麻烦，习惯后就成了自然。你不用一下子记住所有规范，先从”参数化查询防SQL注入”和”输出转义防XSS”这两个最基础的做起，慢慢积累。如果不知道自己的代码有没有问题，不妨现在就装个Bandit扫一下——说不定会有惊喜（或者惊吓）。

如果你试了这些方法，或者有自己的安全编码小技巧，欢迎回来留言分享！咱们一起把Python代码写得又高效又安全。

日常开发里最容易踩坑的，其实就是那些你觉得“应该没事”的场景，我带你回忆几个常见的坑。就说“信任外部输入”这点吧，我之前带团队做一个内部管理系统时，有个同事处理用户反馈功能，前端传过来的“反馈内容”直接用f-string拼到了邮件模板里，发邮件给管理员。当时他说“都是同事，不会乱输东西”，结果过了两天，管理员收到一封邮件，内容里嵌了alert(document.cookie)，虽然没造成损失，但把管理员吓了一跳——你看，就算是内部用户，也可能手滑输错，或者有人好奇试试水，一旦成功就是XSS漏洞。

再比如文件上传功能，我见过太多人图省事，直接用用户传的文件名保存。之前有个电商项目，用户上传商品图片，后端用request.files['image'].save(f'/static/upload/{filename}')，结果被人传了个名叫“../../etc/passwd”的文件，虽然服务器权限控制得严没读取成功，但想想都后怕——如果服务器配置有漏洞，这就能直接遍历系统文件了。还有日志打印，我之前review代码时发现，有人在用户登录失败时打日志：“用户{username}登录失败，密码{password}”，虽然是调试用，但万一日志被导出，密码就全暴露了。这些场景总被“用户是自己人”“数据不重要”当借口简化，但漏洞可不看你是不是“自己人”。

权限控制这块更隐蔽，很多人觉得“登录了就行”，却忽略了“权限粒度”。就像后台系统里查订单，你可能验证了用户是“管理员”，但没验证这个订单是不是归他管的区域。我之前帮朋友看一个物流系统，管理员查订单的接口是/api/orders?order_id=xxx，只验了管理员token，没验order_id对应的订单是否属于该管理员辖区，结果有个管理员把order_id改成别人辖区的，就能看到所有订单数据。还有API接口里用用户ID当参数的，比如/api/user/profile?user_id=123，如果只验了登录状态，没查user_id是不是当前登录用户的ID，用户改个数字就能看别人的资料——这种“只验身份不验权限”的坑，比你想的更常见，而且一旦被利用，数据泄露就是批量的。

日常开发中，哪些场景最容易忽略安全编码规范？

最容易忽略的场景集中在“信任外部输入”和“权限控制简化”上。比如：接收URL参数、表单提交后直接拼接SQL（像文章里提到的字符串格式化SQL）；前端传过来的用户ID直接用于查询数据，不验证是否属于当前用户；文件上传功能中，直接用用户提供的文件名保存到服务器（可能导致路径遍历）；还有日志打印时包含完整手机号、身份证号等敏感信息。这些场景往往因为“用户是内部人员”“数据不敏感”等理由被简化，但实际是高危漏洞的温床。

除了Bandit，还有哪些工具可以帮助检查Python代码安全？

除了Bandit（静态代码分析），推荐三个实用工具：① Safety：检查项目依赖包是否存在已知漏洞（比如使用pip install safety后，运行safety check即可）；② Snyk：不仅扫描代码，还能检测依赖、容器镜像的安全问题，支持集成到CI/CD流程；③ Semgrep：自定义规则检查代码模式，比如可以写规则扫描“直接使用eval(user_input)”这类危险操作。这些工具配合使用，能从代码、依赖、部署多维度保障安全。

参数化查询和ORM框架（如SQLAlchemy）哪个更安全？

两者本质上不冲突，ORM框架（如SQLAlchemy、Django ORM）的底层其实就是参数化查询。比如用SQLAlchemy的User.query.filter_by(username=username).first()，内部会自动转换为参数化SQL，比手动写参数化查询更不容易出错。所以优先推荐使用成熟的ORM框架——它们不仅帮你做参数化，还会处理数据类型校验、异常捕获等问题。如果必须手写原生SQL，再严格用参数化查询（如cursor.execute(“SELECT

FROM users WHERE id=%s”, (user_id,))），避免直接拼接字符串。

如何快速判断代码是否存在XSS漏洞？有自查小技巧吗？

记住一个核心：“用户输入是否直接输出到HTML/JS/CSS中”。自查时可以：① 全局搜索代码里的模板渲染（如Flask的render_template、Django的{{ variable }}），看变量是否经过html.escape等转义处理；② 前端页面渲染后，用浏览器“开发者工具→Elements”查看对应位置的HTML源码，若用户输入的特殊字符（如 “）被转义成 “，则相对安全；③ 故意输入alert(1)作为测试数据，提交后若页面没有弹出alert，且源码中显示转义后的字符，说明XSS防护有效。

安全编码会影响开发效率吗？如何平衡安全和效率？

初期可能会觉得“多了几步操作”，但长期看反而能提升效率——避免线上漏洞修复的返工时间（比如紧急回滚、数据恢复）。平衡方法有：① 把安全检查融入开发流程（如用pre-commit钩子自动跑Bandit，提交代码时自动检查）；② 团队共享“安全编码checklist”（比如SQL必须用参数化/ORM、用户输入必验证、敏感数据必脱敏），新人上手更快；③ 优先解决高危场景（如支付、用户认证相关代码），非核心功能可后续优化。亲测这样操作后，团队平均开发周期反而缩短了15%——因为漏洞导致的“无效开发”减少了。

掌握Python安全编码规范：告别常见漏洞，提升代码安全性

从漏洞根源学规范：你写的代码可能正在”裸奔”

用%s或?作为占位符，不同数据库驱动语法可能不同

把规范变成习惯：安全编码的落地三板斧

第一板斧：用工具当”安全保镖”，让漏洞无处遁形

第二板斧：培养”安全三问”，写代码前先过脑子

第三板斧：让安全融入团队协作，而不是个人单打独斗

日常开发中，哪些场景最容易忽略安全编码规范？

除了Bandit，还有哪些工具可以帮助检查Python代码安全？

参数化查询和ORM框架（如SQLAlchemy）哪个更安全？

如何快速判断代码是否存在XSS漏洞？有自查小技巧吗？

安全编码会影响开发效率吗？如何平衡安全和效率？

猜你喜欢

特征提取算法怎么选？机器学习常用方法对比及实战应用指南

揭秘R语言AI创新方向：哪些领域机会最大？

Python边缘计算实战：手把手教你从环境搭建到项目部署，小白也能上手

零基础如何抓住R语言AI平台机会？发展红利与入门攻略

深度学习零基础入门：从小白到实战的超详细自学路线，附必备技能清单

并发安全问题怎么解决？程序员必看的避坑实战指南