Como revisar el estado de un servidor con linux:
fecha y hora
# date Fri Nov 26 09:15:44 COT 2010
Espacio de almacenamiento
# df -h Filesystem Size Used Avail Use% Mounted on /dev/hda 222G 8.2G 13G 40% / /dev/hda1 874M 24M 805M 3% /boot tmpfs 12G 0 12G 0% /dev/shm
Revise que Use sea menor a 90%
load average
# uptime 12:15:07 up 157 days, 20:52, 5 users, load average: 5.63, 13.40, 10.63
Los últimos 3 numero son la carga promedio para el ultimo minuto(5.63), los últimos 5 minutos(13.40) y los últimos 15 minutos(10.63)
Revise que la carga promedio de los últimos 15 minutos sea menor al numero de procesadores que tenga la maquina.
Numero de procesadores que tiene la maquina:
# grep 'model name' /proc/cpuinfo | wc -l 6
Para mas información ver: http://blog.scoutapp.com/articles/2009/07/31/understanding-load-averages
Memoria
#free -m
total used free shared buffers cached
Mem: 96745 39078 57666 0 55 4751
-/+ buffers/cache: 34271 62473
Swap: 2996 4 2991- La memoria libre para el uso de las aplicaciones se encuentra en la columna -/+ buffers/cache fila free que para este ejemplo seria 62473
- Lo ideal es usar una cantidad muy pequeña de swap
Para mas información ver: linuxatemyram.com http://salomie.ro/wiki/index.php/Linux_Free_Command http://chrisjohnston.org/2009/why-on-linux-am-i-seeing-so-much-ram-usage
Listado de procesos organizado por el uso de memoria.
#ps aux --sort:rss | less USER PID CPU MEM VSZ RSS TTY STAT START TIME COMMAND root 2 0.0 0.0 0 0 ? S Oct15 0:00 [kthreadd] root 3 0.0 0.0 0 0 ? S Oct15 0:05 [migration/0] root 1352 0.0 0.1 1648 512 hvc0 Ss+ Oct15 0:00 /sbin/getty 38400 hvc0 root 1 0.0 0.1 1984 632 ? Ss Oct15 0:01 init [2] root 1321 0.0 0.1 2040 876 ? Ss Oct15 0:10 /usr/sbin/cron root 25758 0.0 0.1 2296 904 pts/0 R+ 08:18 0:00 ps aux --sort:rss root 1290 0.0 0.2 5276 1024 ? Ss Oct15 0:15 /usr/sbin/sshd sshd 25757 0.0 0.2 6620 1352 ? S 08:18 0:00 sshd: unknown [net] root 1276 0.0 0.2 29172 1404 ? Sl Oct15 0:13 /usr/sbin/rsyslogd -c3 root 24895 0.0 0.3 2828 1596 pts/0 Ss 08:10 0:00 -bash root 25756 1.0 0.4 6804 2504 ? Ss 08:18 0:00 sshd: unknown [priv] root 24836 0.0 0.5 8172 2688 ? Ss 08:09 0:00 sshd: root@pts/0 root 11039 0.0 1.7 41684 8848 ? Ss Oct17 0:00 /usr/sbin/apache2 -k start www-data 1312 0.0 2.8 42664 14508 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 1314 0.0 2.8 42664 14508 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 1308 0.0 2.8 42664 14512 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 1309 0.0 2.8 42664 14516 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 1310 0.0 2.8 42664 14516 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 28625 0.0 3.0 43816 15440 ? S Nov21 0:08 /usr/sbin/apache2 -k start www-data 28735 0.0 3.0 43816 15440 ? S Nov21 0:08 /usr/sbin/apache2 -k start www-data 28626 0.0 3.0 43816 15448 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 1311 0.0 3.0 43816 15452 ? S Nov21 0:07 /usr/sbin/apache2 -k start www-data 28622 0.0 5.4 53284 27912 ? S Nov21 0:08 /usr/sbin/apache2 -k start
# vmstat 5 procs -----------memory---------- ---swap--- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 3 0 833704 54824 25196 328672 10 0 343 18 510 1382 96 4 0 0 6 0 833704 54556 25092 324584 0 0 333 22 504 1180 93 7 0 0 4 0 833704 51516 25112 320856 33 0 315 19 508 1234 95 5 0 0 3 0 833704 54836 24984 314404 6 0 223 27 498 1191 95 5 0 0 3 0 833704 53072 24944 307844 4 0 216 22 518 1375 96 4 0 0 5 0 833704 53928 24888 304076 6 0 262 18 548 1665 94 6 0 0 3 4 843964 50192 184 58064 16 2416 16 2464 570 1451 78 22 0 0 3 7 908244 48756 224 47760 118 13645 149 13664 730 1245 76 16 0 8 3 2 922064 54280 340 49228 1470 2838 1817 2865 711 1481 88 12 0 0 4 2 932644 54068 424 52204 1972 2195 2596 2211 678 1388 90 10 0 0 2 3 944012 56304 492 52292 2986 2591 3063 2615 735 1562 89 11 0 0 2 4 957304 54604 572 51964 4042 3414 4096 3438 852 1808 88 12 0 0
Cuando los valores de las columnas si("swap in") y so("swap out") son muy altos el sistema esta sufriendo de hiperpaginación (thrashing en Inglés) y seria bueno aumentarle la cantidad de memoria RAM
Para mas información ver: http://linux-mm.org/Low_On_Memory
IO
# iostat -dx 5 Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm util sda 1.09 86.38 32.78 63.79 791.90 1201.66 20.65 0.21 5.37 2.36 22.77 sda1 0.00 0.00 0.00 0.00 0.00 0.00 12.16 0.00 40.69 37.64 0.00 sda2 0.00 0.00 0.00 0.00 0.00 0.00 86.75 0.00 21.94 18.66 0.00 sda3 1.09 86.38 32.78 63.79 791.90 1201.66 20.65 0.21 5.37 2.36 22.77 dm-0 0.00 0.00 33.87 150.16 791.71 1201.25 10.83 0.00 1.72 1.24 22.77 dm-1 0.00 0.00 0.00 0.04 0.03 0.31 8.43 0.02 450.58 0.39 0.00 dm-2 0.00 0.00 0.00 0.01 0.17 0.10 19.13 0.00 225.66 5.86 0.01 sdc 0.70 91.35 17.99 44.80 476.31 1089.46 24.94 0.09 6.37 1.15 7.25 dm-3 0.00 0.00 18.69 136.18 476.31 1089.46 10.11 0.29 1.84 0.47 7.25 Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm util sda 0.00 15.00 14.40 18.40 139.20 267.20 12.39 1.99 60.52 3.47 11.38 sda1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 sda2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 sda3 0.00 15.00 14.40 18.40 139.20 267.20 12.39 1.99 60.52 3.47 11.38 dm-0 0.00 0.00 14.40 33.40 139.20 267.20 8.50 2.32 48.58 2.37 11.32 dm-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 dm-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 sdc 4.40 41.00 756.60 124.20 9310.40 1321.60 12.07 110.02 125.37 1.14 100.00 dm-3 0.00 0.00 759.00 165.20 9310.40 1321.60 11.50 125.19 135.90 1.08 100.00
El primer bloque es el acumulado, del segundo en adelante es el estado de IO en ese instante, revise en estos que util sea menor a 80
