nginx介绍:
官网:http://nginx.org。基于官方文档更有参考价值,所以这里基本只是以附加网址的形式翻译部分常用指令而已。
点击”简体中文“,可以看到nginx的特性总结。
1、自动索引:与Apache一样,当web服务器目录中没有首页文件index.html时,会自动将当前目录下所有的文件列出来。
2、打开文件描述符缓存:在linux中,被访问的文件的元数据首先需要被载入buffer、cache,而nginx则可以直接将页面文件的元数据信息缓存下来。
3、支持验证http referer:防盗链功能,也就是访问A网站的一个图片时,图片打不开,可能还会显示”此图片仅供B网站用户查看“。
4、sendfile:当用户请求一个网页内容时,其数据需要从网卡进入,经过tcp拆封装后,发现是送给监听在80端口的web进程时,然后给它。
web进程接受请求,发现是请求网站首页内容,于是向内核发起系统调用,要求进行I/O调取首页文件。
内核进行I/O后,将文件先放到内核内存,再复制到web进程内存,web进程再进行封装,然后再发送到内核的网络模块,最后才从网卡走掉。
这样响应数据从 “硬盘”→“内核空间”→“web进程”→“内核空间网络模块”,突然多走了一个很多路程。
而sendfile就是让数据直接从“内核空间”→“内核空间网络模块”这样走直道的,也就是数据在内核空间内就完成了响应封装。
sendfile支持的文件比较小,所以后来出现了sendfile_x64。
5、directI/O,与异步I/O(AIO)完全不同,,它是经过内核缓冲区,直接发送到磁盘上。
6、mmap支持,也就是内核空间到nginx空间的数据映射
7、平滑升级:
nginx的工作模式是有一个master主进程,和N个worker工作线程。
master主进程只复制读取配置、按需生成、回收worker工作线程。而worker线程只负责响应用户请求。
当nginx升级时只需要将二进制执行文件替换即可,当有新连接进来时,就会使用新的worker线程。而旧的连接依然会使用旧的worker线程,直到断开为止才会被回收。
8、不支持动态加载模块,不过改版的Tengine则可以。
CentOS6.4平台上nginx的安装:
1、解决依赖关系
# yum groupinstall "Development Tools" "Server Platform Deveopment"      
# yum -y install openssl-devel pcre-devel
2、安装
首先添加nginx用户,实现以其运行nginx服务进程:
# groupadd -r nginx      
# useradd -r -g nginx nginx
接着开始编译和安装:      
# ./configure \       
  --prefix=/usr \       
  --sbin-path=/usr/sbin/nginx \       
  --conf-path=/etc/nginx/nginx.conf \       
  --error-log-path=/var/log/nginx/error.log \       
  --http-log-path=/var/log/nginx/access.log \       
  --pid-path=/var/run/nginx/nginx.pid  \       
  --lock-path=/var/lock/nginx.lock \       
  --user=nginx \       
  --group=nginx \       
  --with-http_ssl_module \       
  --with-http_flv_module \       
  --with-http_stub_status_module \       
  --with-http_gzip_static_module \       
  --http-client-body-temp-path=/var/tmp/nginx/client/ \       
  --http-proxy-temp-path=/var/tmp/nginx/proxy/ \       
  --http-fastcgi-temp-path=/var/tmp/nginx/fcgi/ \       
  --http-uwsgi-temp-path=/var/tmp/nginx/uwsgi \       
  --http-scgi-temp-path=/var/tmp/nginx/scgi \       
  --with-pcre       
# make && make install
3、为nginx提供SysV init脚本:
新建文件/etc/rc.d/init.d/nginx,内容如下:      
#!/bin/sh       
#       
# nginx - this script starts and stops the nginx daemon       
#       
# chkconfig:   - 85 15       
# description:  Nginx is an HTTP(S) server, HTTP(S) reverse \       
#               proxy and IMAP/POP3 proxy server       
# processname: nginx       
# config:      /etc/nginx/nginx.conf       
# config:      /etc/sysconfig/nginx       
# pidfile:     /var/run/nginx.pid       
  
# Source function library.       
. /etc/rc.d/init.d/functions       
  
# Source networking configuration.       
. /etc/sysconfig/network       
  
# Check that networking is up.       
[ "$NETWORKING" = "no" ] && exit 0       
  
nginx="/usr/sbin/nginx"       
prog=$(basename $nginx)       
  
NGINX_CONF_FILE="/etc/nginx/nginx.conf"       
  
[ -f /etc/sysconfig/nginx ] && . /etc/sysconfig/nginx       
  
lockfile=/var/lock/subsys/nginx       
  
make_dirs() {       
   # make required directories       
   user=`nginx -V 2>&1 | grep "configure arguments:" | sed ‘s/[^*]*--user=\([^ ]*\).*/\1/g‘ -`       
   options=`$nginx -V 2>&1 | grep ‘configure arguments:‘`       
   for opt in $options; do       
       if [ `echo $opt | grep ‘.*-temp-path‘` ]; then       
           value=`echo $opt | cut -d "=" -f 2`       
           if [ ! -d "$value" ]; then       
               # echo "creating" $value       
               mkdir -p $value && chown -R $user $value       
           fi       
       fi       
   done       
}       
  
start() {       
    [ -x $nginx ] || exit 5       
    [ -f $NGINX_CONF_FILE ] || exit 6       
    make_dirs       
    echo -n $"Starting $prog: "       
    daemon $nginx -c $NGINX_CONF_FILE       
    retval=$?       
    echo       
    [ $retval -eq 0 ] && touch $lockfile       
    return $retval       
}       
  
stop() {       
    echo -n $"Stopping $prog: "       
    killproc $prog -QUIT       
    retval=$?       
    echo       
    [ $retval -eq 0 ] && rm -f $lockfile       
    return $retval       
}       
  
restart() {       
    configtest || return $?       
    stop       
    sleep 1       
    start       
}       
  
reload() {       
    configtest || return $?       
    echo -n $"Reloading $prog: "       
    killproc $nginx -HUP       
    RETVAL=$?       
    echo       
}       
  
force_reload() {       
    restart       
}       
  
configtest() {       
  $nginx -t -c $NGINX_CONF_FILE       
}       
  
rh_status() {       
    status $prog       
}       
  
rh_status_q() {       
    rh_status >/dev/null 2>&1       
}       
  
case "$1" in       
    start)       
        rh_status_q && exit 0       
        $1       
        ;;       
    stop)       
        rh_status_q || exit 0       
        $1       
        ;;       
    restart|configtest)       
        $1       
        ;;       
    reload)       
        rh_status_q || exit 7       
        $1       
        ;;       
    force-reload)       
        force_reload       
        ;;       
    status)       
        rh_status       
        ;;       
    condrestart|try-restart)       
        rh_status_q || exit 0       
            ;;       
    *)       
        echo $"Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload|configtest}"       
        exit 2       
esac
而后为此脚本赋予执行权限:      
# chmod +x /etc/rc.d/init.d/nginx
添加至服务管理列表,并让其开机自动启动:      
# chkconfig --add nginx       
# chkconfig nginx on
而后就可以启动服务并测试了:      
# service nginx start
二、配置nginx:
Nginx的核心模块为Main和Events,此外还包括标准HTTP模块、可选HTTP模块和邮件模块,其还可以支持诸多第三方模块。Main用于配置错误日志、进程及权限等相关的参数,Events用于配置IO模型,如epoll、kqueue、select或poll等,它们是必备模块。
Nginx的主配置文件由几个段组成,这个段通常也被称为nginx的上下文,每个段的定义格式如下所示。需要注意的是,其每一个指令都必须使用分号(;)结束,否则为语法错误。
<section> {      
    <directive> <parameters>;       
}
2.1.1 error_log
用于配置错误日志,可用于main、http、server及location上下文中;语法格式为:
error_log file | stderr [ debug | info | notice | warn | error | crit | alert | emerg ]
如果在编译nginx时使用了--with-debug选项,还可以使用如下格式打开调试功能。
error_log LOGFILE [debug_core | debug_alloc | debug_mutex | debug_event | debug_http | debug_imap];
要禁用错误日志,不能使用“error_log off;”,而要使用类似如下选项:
error_log /dev/null crit;
2.1.2 timer_resolution
用于降低gettimeofday()系统调用的次数。默认情况下,每次从kevent()、epoll、/dev/poll、select()或poll()返回时都会执行此系统调用。语法格式为:
timer_resolution interval
例如:
timer_resolution 100ms;
      
2.1.3 worker_priority
为worker进程设定优先级(指定nice值),此参数只能用于main上下文中,默认为0;语法格式为:
worker_priority number;(-20,20)
2.1.4 worker_processes
worker进程是单线程进程。
如果Nginx用于CPU密集型的场景中,如SSL或gzip,且主机上的CPU个数至少有2个,那么应该将此参数值设定为与CPU核心数相同;
如果Nginx用于大量静态文件访问的场景中,且所有文件的总大小大于可用内存时,应该将此参数的值设定得足够大以充分利用磁盘带宽。
此参数与Events上下文中的work_connections变量一起决定了maxclient的值:      
maxclients = work_processes * work_connections
2.1.5 worker_cpu_affinity
通过sched_setaffinity()将worker绑定至CPU上,减少上下文切换,提升性能。只能用于main上下文。语法格式为:
worker_cpu_affinity cpumask ...
cpumask中的1表示cpu的那个核心被绑定了。
例如:      
worker_processes     4;       
worker_cpu_affinity 0001 0010 0100 1000;
worker_processes 2;
2.1.6 worker_rlimit_nofile
设定worker进程所能够打开的文件描述符个数的最大值。语法格式:
worker_rlimit_nofile number;
注意,这时如果使用ab命令测试是不行的。number一般为51200即可。
2.2 配置Events模块
2.2.1 worker_connections
设定每个worker所处理的最大连接数,它与来自main上下文的worker_processes一起决定了maxclients的值。
max clients = worker_processes * worker_connections
而在反向代理场景中,其计算方法与上述公式不同,因为默认情况下浏览器将打开2个连接,而nginx会为每一个连接打开2个文件描述符,因此,其maxclients的计算方法为:
max clients = worker_processes * worker_connections/4
2.2.2 use
在有着多于一个的事件模型IO的应用场景中,可以使用此指令设定nginx所使用的IO机制,默认为./configure脚本选定的各机制中最适用当前OS的版本。语法格式:
use [ kqueue | rtsig | epoll | /dev/poll | select | poll | eventport ]
2.3 一个配置示例
user nginx;      
# the load is CPU-bound and we have 16 cores       
worker_processes 16;       
error_log /var/log/nginx/error.log;       
pid /var/run/nginx.pid;
events {      
    use epoll;       
    worker_connections 2048;       
}
2.4 HTTP服务的相关配置
http上下文专用于配置用于http的各模块,此类指令非常的多,每个模块都有其专用指定,具体请参数nginx官方wiki关于模块部分的说明。大体上来讲,这些模块所提供的配置指令还可以分为如下几个类别。
客户端类指令:如client_body_buffer_size、client_header_buffer_size、client_header_timeout和keepalive_timeout等;
文件IO类指令:如aio、directio、open_file_cache、open_file_cache_min_uses、open_file_cache_valid和sendfile等;
hash类指令:用于定义Nginx为某特定的变量分配多大的内存空间,如types_hash_bucket_size、server_names_hash_bucket_size和variables_hash_bucket_size等;
套接字类指令:用于定义Nginx如何处理tcp套接字相关的功能,如tcp_nodelay(用于keepalive功能启用时)和tcp_nopush(用于sendfile启用时)等;
listen address[:port];监听端口,必需的。
server_name HOSTNAME;一般定义在server中
下面的两个指令一般定义在server中,或者是server中的location中:
root /path/to/webroot;定义URI的起始路径,
index index.html index.php index.html
2.5 虚拟服务器相关配置
server {      
    <directive> <parameters>;       
}
用于定义虚拟服务器相关的属性,常见的指令有backlog、rcvbuf、bind及sndbuf等。
2.6 location相关的配置
location [modifier] uri {...} 或 location @name {…}
通常用于server,或者location嵌套中,无法用在httpd段:
当某个URI想使用其他的路径,或者某个URI想具有独特的访问控制权限时,这时location就用到了。虽然location与下文将要讲到的IF指令有相同之处,但是就使用正则表达式进行URI匹配的时,location用的比IF多。
每个location下面的权限及代理内容不同,浏览器得到的内容也会受其限定。
location [ = | ^~ | ~ | ~* | 无 ] URI { … }
上面5中情况中,其优先级是依次递减:
(下面样例中,主机名均使用IP地址,而网页根目录是/web/htdocs,下面有images目录、docs目录,error目录、bbs等目录,且各目录下均由与其目录同名的网页内容的index.html文件,以方便实验)
= :做精确匹配。比如:
location = /images {
root /web/htdocs/images;
index index.html;
}
浏览器访问http://IP/images/时,就直接访问/web/htdocs/images目录中的文件了,而且其访问权限直接受此location的限制。
^~ :其后的内容不允许使用正则进行匹配。
~ :使用正则进行模式匹配,但是区分大小写。(对于点,要加反斜线)
~* :不区分大小写的模式匹配。
无 :级别最低。一般用在根下。
制作一个自定义的错误页面,防止返回给用户的是一个生硬的错误页面:
error_page 404 sorry.html;
location = /sorry.html {
root /web/htdocs/error;
}
location @name {…}
server {      
  location / {       
    set $memcached_key $uri;       
    memcached_pass     name:11211;       
    default_type       text/html;       
    error_page         404 @fallback;       
  }       
  
  location @fallback {       
    proxy_pass http://backend;      
  }      
}
这里是memcached的一个反向代理,也就是nginx将memcached作为缓存服务器,而不是自己。当memcached没有命中时,再将这个请求发送给其他的upstream进行响应。
原文:http://caduke.blog.51cto.com/3365689/1548566