Linux进程管理常用命令详解｜从入门到精通-XMJoy 编程学院

Q: 如何快速找到占用CPU或内存最高的进程？

可以用 ps 命令按资源占用排序，比如 ps aux sort=-%cpu | head -10 显示CPU占用前10的进程，ps aux sort=-%mem | head -10 显示内存占用前10的进程。也可以用 top 命令实时监控，按 P 按CPU排序，按 M 按内存排序，直观又高效。

Q: 后台运行的进程关闭终端后就停止，怎么让它一直运行？

这是因为终端关闭会给进程发送 SIGHUP 信号导致终止，用 nohup 命令可以忽略该信号。正确用法是 nohup 命令 > 日志文件 2>&1 &，比如 nohup ./data_sync.sh > sync.log 2>&1 &，这样即使关闭终端，进程也会在后台持续运行，输出还会保存到日志文件。

Q: kill -9 和 kill -15 有什么区别？应该优先用哪个？

kill -15（默认信号，可省略参数）会给进程发送 SIGTERM 信号，让进程有时间清理资源（如保存数据、释放端口）后再退出，属于“优雅终止”；kill -9 发送 SIGKILL 信号，会强制终止进程，可能导致数据丢失或资源未释放。建议优先用 kill -15 PID，如果进程无响应再尝试 kill -9 PID。

Q: 如何调整正在运行的进程优先级？

可以用 renice 命令修改已运行进程的优先级（nice 值，范围-20到19，值越小优先级越高）。比如 renice -n -5 1234 表示将 PID 为1234的进程优先级提高（nice 值从默认0降到-5）；新启动进程时，可用 nice -n 10 ./app.sh 直接设置低优先级，避免抢占关键服务资源。

文章目录▼CloseOpen

从ps到top：搞懂进程查看的「三板斧」
进程启停与后台管理：告别「终端一关进程就丢」

进阶进程监控与问题排查技巧
- htop vs top：为什么高手都爱用前者？
- 进程优先级调整与异常处理：让系统资源分配更聪明
如何快速找到占用CPU或内存最高的进程？
后台运行的进程关闭终端后就停止，怎么让它一直运行？
kill -9 和 kill -15 有什么区别？应该优先用哪个？
如何调整正在运行的进程优先级？
htop 比 top 好在哪里？新手需要特意学吗？

你刚开始接触Linux命令行时，是不是每次想看看系统里跑了哪些程序，一输入ps就被满屏的英文输出吓退？或者用top监控时，盯着闪烁的数字半天不知道该看哪个指标？其实进程管理没那么复杂，我刚开始学的时候也踩过不少坑——比如以为kill命令只有kill -9这一种用法，结果不小心把同事正在运行的数据库进程直接干掉，差点背锅。今天就从最基础的命令开始，带你一步步掌握那些每天都要用的进程管理工具，保证你看完就能上手实操。

从`ps`到`top`：搞懂进程查看的「三板斧」

进程其实就是系统中正在运行的程序实例，每个进程都有一个唯一的ID，也就是PID。我们日常管理的第一步，就是「看见」这些进程——而ps和top就是最常用的「放大镜」。

先说ps命令，它就像给进程拍张快照，瞬间显示当前的进程状态。新手最常用的可能是ps aux，但你知道吗？这个命令其实是BSD风格的参数（a显示所有用户进程，u显示详细信息，x显示无终端的进程）。如果你用惯了System V风格，ps -ef会更顺手，输出格式略有不同但核心信息一致。我刚开始分不清这两种风格，每次都要查笔记，后来发现记住一个自己常用的就行——比如我现在基本只用ps aux sort=-%cpu | head -10，直接按CPU占用排序，看前10个最耗资源的进程，效率超高。

命令格式	风格类型	核心功能	输出特点	适用场景
`ps aux`	BSD风格	显示所有用户进程详情	包含%CPU、%MEM、STAT状态	快速排查高资源进程
`ps -ef`	System V	显示进程树及父进程关系	包含PPID（父进程ID）	追踪进程启动源头
`ps -l`	简洁格式	显示当前终端关联进程	包含PRI（优先级）、NI值	查看当前终端进程状态

top

命令则是「动态监控神器」，默认每3秒刷新一次，实时显示进程资源占用。你按P可以按CPU使用率排序，按M按内存排序，按k直接输入PID就能发送信号终止进程——这个快捷键我用了三年才发现，之前都是记住PID再开一个终端输kill，简直笨办法。不过要注意，top默认显示的CPU使用率是「累积值」，如果想实时看瞬时占用，可以按1展开所有CPU核心，按i忽略闲置进程，界面会清爽很多。我去年帮朋友维护博客服务器时，他总说系统卡顿，我远程上去开top一看，有个Python脚本占了90%的CPU，按k输入PID，选信号15（SIGTERM）让它优雅退出，不到10秒系统就恢复正常了——这比直接重启服务可稳妥多了。

进程启停与后台管理：告别「终端一关进程就丢」

你肯定遇到过这种情况：远程连接服务器跑脚本，中途网络断了，再连上去发现进程没了——这就是没做好后台进程管理的锅。我刚开始用&把命令丢到后台（比如python script.py &），结果终端一关还是会被杀掉，后来才知道需要nohup命令（no hang up的缩写），它能忽略终端断开的信号。正确用法是nohup ./long_run.sh > output.log 2>&1 &，把标准输出和错误都重定向到日志文件，就算关掉终端，进程也能在后台跑到结束。

如果进程已经在前台运行，按Ctrl+Z可以暂停它，然后用bg命令让它在后台继续执行（比如bg 1，这里的「1」是jobs命令显示的任务编号）。想把后台进程调回前台？用fg 1就行。我上周在本地服务器跑数据备份，命令输完才发现要跑2小时，赶紧按Ctrl+Z暂停，bg丢后台，再用jobs确认状态，完美解决「终端被占用」的问题。

至于kill命令，你可别上来就kill -9（强制终止）。进程终止信号有很多种，最常用的-15（SIGTERM）会让进程先清理资源再退出，比如保存临时文件、释放端口，而-9（SIGKILL）是「终极手段」，直接强制结束，可能导致数据丢失。我之前管理MySQL服务器时，有次数据库进程卡死，先用kill -15试了两次没反应，才用kill -9强制杀掉，重启后发现事务日志有损坏——这就是教训，非必要别用-9。如果你不知道某个信号的含义，kill -l可以列出所有信号列表，比如-1（SIGHUP）常用于让进程重读配置文件，像Nginx重载配置用的nginx -s reload，本质就是给主进程发SIGHUP信号。

进阶进程监控与问题排查技巧

学会了基础命令，你可能会发现：用top看进程太枯燥，排查异常进程时效率不够高。这时候就得靠进阶工具和技巧了。我从运维新手到能独立处理服务器故障，很大程度上是靠这些「效率工具」和「实战经验」——毕竟光会用命令不行，还得知道怎么用它们解决实际问题。

`htop` vs `top`：为什么高手都爱用前者？

如果你觉得top界面太简陋，试试htop——它就像top的「增强版」，支持鼠标操作、彩色显示进程状态、横向滚动查看完整命令行，还能直接按F6排序、F9发送信号，对新手太友好了。我刚开始觉得「不就个监控工具吗，没必要换」，直到有次排查Java进程，top里进程名只显示java，根本分不清是哪个服务，而htop能直接看到完整的java -jar /app/service.jar命令行，一眼定位问题。现在我所有服务器都默认装htop，用yum install htop -y（CentOS）或apt install htop -y（Ubuntu）就能装，几秒钟的事，效率提升一大截。

不过要注意，htop默认不显示进程的父进程关系，如果你需要追踪进程树，按F5切换到树形视图就行。另外它的CPU使用率是「瞬时值」，比top的累积值更直观，比如某个进程突然飙升到100%，htop能立刻捕捉到，这对排查「间歇性高负载」特别有用。

进程优先级调整与异常处理：让系统资源分配更聪明

Linux进程有优先级之分，用nice值（-20到19，值越小优先级越高）控制。你新启动进程时可以用nice -n 5 ./app.sh让它优先级降低，避免抢占关键服务资源；如果某个进程已经在运行，用renice -n -10 1234（1234是PID）就能提高它的优先级。我之前在服务器上同时跑数据备份和Web服务，备份脚本总抢CPU导致网站卡顿，后来给备份进程设了nice 10，Web服务设nice -5，两者井水不犯河水——这就是「资源调度的艺术」。

遇到僵尸进程（Z状态）怎么办？这种进程已经终止但父进程没回收它的资源，ps aux里STATUS列显示Z+。你直接kill僵尸进程没用，得找到它的父进程（PPID列），重启父进程或终止父进程。比如ps -ef | grep defunct找到僵尸进程PID，再用ps -o ppid= -p 僵尸PID获取父进程PID，最后kill -15 父进程PID。我去年遇到过Nginx产生僵尸进程的情况，查了Nginx官方文档（https://nginx.org/en/docs/faq/daemon_master_process.htmlnofollow）才知道是worker进程异常退出导致，重启Nginx后僵尸进程就消失了——遇到问题多看官方文档，比瞎猜靠谱多了。

如果你想深入监控进程的内存、IO情况，pmap和iotop是好帮手。pmap -x PID能显示进程的内存映射，帮你定位内存泄露；iotop则类似top，但专门监控磁盘IO，哪个进程在疯狂读写硬盘一目了然。这些工具平时用得少，但关键时刻能帮你找到「隐藏的凶手」——就像医生用CT扫描一样，比光靠眼睛看症状精准多了。

这些技巧你不用一次全记住，先把ps、top、kill练熟，遇到问题时多查参数、多试场景，慢慢就会形成自己的「排查套路」。比如我现在处理服务器问题，习惯先top看资源占用，ps aux找异常进程，netstat查端口占用，三步下来80%的问题都能定位。你也可以找台测试服务器，故意跑个死循环脚本（比如while true; do ; done），然后用学到的命令去监控、终止、调整优先级，练上几次就熟了。如果试的时候遇到什么奇怪的问题，或者发现更实用的命令组合，欢迎留言告诉我——毕竟Linux命令这么多，互相分享经验才能进步更快嘛。

你有没有遇到过这种情况？远程连接服务器跑个数据备份脚本，中途手滑把终端关了，再连上去一看——脚本早就停了，白跑半天。这其实是因为终端就像进程的“老板”，老板一走（终端关闭），系统就会给所有关联的进程发一个叫SIGHUP的“下班信号”，进程接到信号就乖乖终止了。

那怎么让进程“不听话”呢？nohup命令就是干这个的，全称“no hang up”，翻译过来就是“别挂断我”。它的作用很简单：让进程忽略SIGHUP信号，就算终端关了也继续跑。不过光用nohup还不够，你得把输出重定向到文件，不然进程可能会因为“没地方吐东西”而卡住。我平时的用法是“nohup 命令 > 日志文件 2>&1 &”，比如跑爬虫脚本就写成“nohup python spider.py > crawl.log 2>&1 &”。这里的“> crawl.log”是把正常输出存到日志文件，“2>&1”是把错误信息也丢进去（2代表错误输出，1代表标准输出），最后那个“&”是把进程丢到后台。

上次帮同事处理服务器时，他用“python data_process.py &”跑数据清洗，结果下班关了电脑，第二天发现进程没跑完，数据还丢了一部分。我让他改用nohup命令，第二天再看日志文件，不仅进程跑完了，中间报的几个小错误也清清楚楚记录在log里，排查起来特别方便。下次你跑那种要几小时甚至几天的任务，记得试试这个组合，亲测比单纯用“&”靠谱多了。

如何快速找到占用CPU或内存最高的进程？

可以用 ps 命令按资源占用排序，比如 ps aux sort=-%cpu | head -10 显示CPU占用前10的进程，ps aux sort=-%mem | head -10 显示内存占用前10的进程。也可以用 top 命令实时监控，按 P 按CPU排序，按 M 按内存排序，直观又高效。

后台运行的进程关闭终端后就停止，怎么让它一直运行？

这是因为终端关闭会给进程发送 SIGHUP 信号导致终止，用 nohup 命令可以忽略该信号。正确用法是 nohup 命令 > 日志文件 2>&1 &，比如 nohup ./data_sync.sh > sync.log 2>&1 &，这样即使关闭终端，进程也会在后台持续运行，输出还会保存到日志文件。

kill -9 和 kill -15 有什么区别？应该优先用哪个？

kill -15（默认信号，可省略参数）会给进程发送 SIGTERM 信号，让进程有时间清理资源（如保存数据、释放端口）后再退出，属于“优雅终止”；kill -9 发送 SIGKILL 信号，会强制终止进程，可能导致数据丢失或资源未释放。优先用 kill -15 PID，如果进程无响应再尝试 kill -9 PID。

如何调整正在运行的进程优先级？

可以用 renice 命令修改已运行进程的优先级（nice 值，范围-20到19，值越小优先级越高）。比如 renice -n -5 1234 表示将 PID 为1234的进程优先级提高（nice 值从默认0降到-5）；新启动进程时，可用 nice -n 10 ./app.sh 直接设置低优先级，避免抢占关键服务资源。

htop 比 top 好在哪里？新手需要特意学吗？

htop 是 top 的增强版，优势在于：支持鼠标操作、彩色显示进程状态、横向滚动查看完整命令行、直接按快捷键排序（如 F6）或发送信号（如 F9），对新手更友好。安装也简单，CentOS 用 yum install htop -y，Ubuntu 用 apt install htop -y。新手学 htop，上手快且功能更全面，日常监控和管理效率会高很多。

Linux进程管理常用命令详解｜从入门到精通

从ps到top：搞懂进程查看的「三板斧」

进程启停与后台管理：告别「终端一关进程就丢」

进阶进程监控与问题排查技巧

htop vs top：为什么高手都爱用前者？

进程优先级调整与异常处理：让系统资源分配更聪明

如何快速找到占用CPU或内存最高的进程？

后台运行的进程关闭终端后就停止，怎么让它一直运行？

kill -9 和 kill -15 有什么区别？应该优先用哪个？

如何调整正在运行的进程优先级？

htop 比 top 好在哪里？新手需要特意学吗？

猜你喜欢

Ansible Tower权限管理最佳实践：避免权限泄露风险

敏捷运维落地全攻略：5步实施法+工具推荐+避坑指南

容器镜像签名保姆级教程：工具选择、步骤详解及验证方法全流程指南

手动做报告太耗时？3步学会自动化生成方法，每天节省3小时，数据分析效率翻倍

运维数据分析实战技巧：从监控数据到系统优化的落地方法

跨团队协作总低效？3个实用技巧提升协作效率

从`ps`到`top`：搞懂进程查看的「三板斧」

`htop` vs `top`：为什么高手都爱用前者？