ToB企服应用市场:ToB评测及商务社交产业平台

标题: 高性能Web网关:OpenResty 基础解说 [打印本页]

作者: 愛在花開的季節    时间: 13 小时前
标题: 高性能Web网关:OpenResty 基础解说
一:概述

   OpenResty是由国人章亦春开发的一个基于Nginx的可伸缩的Web平台。
            openresty 是一个基于 nginx 与 lua 的高性能 web 平台,其内部集成了大量精良的 lua 库、第三方模块以及大数的依赖项。用于方便搭建能够处置惩罚超高并发、扩展性极高的动态 web 应用、web 服务和动态网关。
        openresty 通过汇聚各种设计精良的 nginx 模块,从而将 nginx有用地酿成一个强大的通用 Web 应用平台。这样,Web 开发职员和系统工程师可以使用 Lua 脚本语言变更 Nginx 支持的各种C 以及 Lua 模块,快速构造出足以胜任 10K 以致 1000K 以上单机并发毗连的高性能 Web 应用系统。
        openresty 的目的是让你的 Web 服务直接跑在 Nginx 服务内部,充分利用 Nginx 的非阻塞 I/O 模型(多reactor 模型),不仅仅对 HTTP 客户端哀求(stream),以致于对长途后端诸如MySQL、PostgreSQL、Memcached 以及 Redis etcd kafka grpc等都进行一致的高性能相应(upstream)。
  让我们先复习一下Nginx

Nginx接纳的是master-worker模型,也就是一个master进程管理多个worker进程,根本的时间处置惩罚都放在worker进程中,master进程负责全局初始化以及对worker进行的管理。
OpenResty中,每个worker进程使用一个LuaVM,当哀求被分配到worker时,将在这个LuaVM中创建一个coroutine协程,协程之间数据隔离,每个协程都具有独立的全局变量。
二:应用场景

   在哀求真正到达上游服务之前,Lua 可以随心所欲的做复杂的访问控制和安全检测;
  随心所欲的操控相应头里面的信息;
  从外部存储服务(比如 Redis,Memcached,MySQL,Postgres)中获取后端信息,并用这些信息来及时选择哪一个后端来完成业务访问;
  在内容 handler 中随意编写复杂的 Web 应用,使用同步但依然非阻塞的方式,访问后端数据库和其他存储;
  在 rewrite 阶段,通过 Lua 完成非常复杂的 URL dispatch用 Lua 可以为 nginx 子哀求和恣意 location,实现高级缓存机制;
  三:Nginx的模块

           nginx 接纳模块化设计,使得每一个 http 模块可以仅专注于完成一个独立的、简单的功能,而一个哀求的完备处置惩罚过程可以由无数个 http 模块共同互助完成。为了灵活有用地指定下一个http 处置惩罚模块是哪一个;http 框架依据常见的的处置惩罚流程将处置惩罚阶段划分为 11 个阶段,其中每一个阶段都可以由恣意多个http 模块流水式地处置惩罚哀求。
        openresty 将 lua 脚本嵌入到 nginx 阶段处置惩罚的末尾模块下;这样以来并不会影响 nginx 原有的功能,而是在 nginx 基础上丰富它的功能;
        嵌入 lua 的长处是:使用 openresty 开发,不需要重新编译,直接修改 lua 脚本,重新启动即可
  

Lua模块的指令顺序


init_by_lua:在 nginx 重新加载设置文件时,运行里面 lua 脚本,常用于全局变量的申请。比方 lua_shared_dict 共享内存的申请,只有当 nginx 重启后,共享内存数据才清空,这常用于统计。
set_by_lua:设置一个变量,常用与盘算一个逻辑,然后返回效果,该阶段不能运行Output API、Control API、Subrequest API、Cosocket API
rewrite_by_lua:在 access 阶段前运行,主要用于 rewrite url;
access_by_lua:主要用于访问控制,这条指令运行于 nginx access 阶段的末尾,因此总是在 allow 和 deny 这样的指令之后运行,它们同属 access 阶段。可用来判断哀求是否具备访问权限;
content_by_lua:阶段是全部哀求处置惩罚阶段中最为重要的一个,运行在这个阶段的设置指令一样平常都肩负着生成内容(content)并输出HTTP 相应。
header_filter_by_lua:一样平常只用于设置 Cookie 和 Headers 等。
body_filter_by_lua:一样平常会在一次哀求中被调用多次,由于这是实现基于 HTTP1.1 chunked 编码的所谓“流式输出”的。
log_by_lua:该阶段总是运行在哀求结束的时候,用于哀求的后续操作,如在共享内存中进行统计数据,假如要高精确的数据统计,应该使用 body_filter_by_lua
Lua嵌入的原理:



cosocket:

openresty 为 nginx 添加的最核心的功能就是 cosocket;自cosocket 到场,可以在 http 哀求处置惩罚中访问第三方服务;
cosocket 主要依据 nginx 中的事件机制(reactor)和 lua 的协程联合后实现了非阻塞网络 io;在业务逻辑使用层面上可以通过同步非阻塞的方式来写代码;
           对于reactor中新的毗连进来,由于黑白阻塞的,刚毗连进来并不知道是否是毗连乐成,他会不绝到添加到epoll红黑树中去,并注册写事件,当触发写事件,我们才知道客户端毗连乐成了。而对于lua的协程来说,他是同步的,会不绝阻塞等候毗连乐成。因此将这俩一联合,实现了非阻塞的网络IO。当代码运行到阻塞毗连的时候,lua协程会让出操作,然后运行其他程序,当毗连乐成,会再次规复操作。这样就形成同步非阻塞的方式了。
          引入 cosocket 后,nginx 中相当于有了多条并行同步逻辑线(lua 协程),nginx 中单线程负责叫醒或让出其中 lua 协程;叫醒或让出依据来源于协程运行的条件是否得到满意;

四:实现重定向和黑名单

1:nginx.conf

  1. openresty -p . -c conf/nginx.conf        //启动
  2. openresty -p . -s stop                    //关闭
复制代码
        在下面的代码实现中不绝遵循上面的11个阶段执行 。当碰到启动不了openresty的时候,多看看他的出错日记即可。
         我们在这个conf文件中实现了黑名单功能,以及重新定向功能。我们在location / 中实现了最基础的黑名单功能,他的局限就在于,每次添加黑名单就需要我们重新启动openresty,非常不方便。而且在这里还实现了重新定向的功能,跳到百度或者本身写的代码中。
  1. worker_processes  4;
  2. events{
  3.     worker_connections  1024;
  4. }
  5. http{
  6.     error_log ./logs/error.log info;            #在这里我们需要自己手动创建logs
  7.     lua_shared_dict bklist 1m;                      #由于每次都连接数据库很浪费资源,于是我们使用共享内存,这里使用的是字典
  8.     init_worker_by_lua_file ./appp/init_worker.lua;  #我们在启动openrest的时候,把他在init_worker的时候加入进去。
  9.     server{
  10.         listen 8989;
  11.         location / {
  12.             rewrite_by_lua_block {          --执行重定向功能
  13.                 local args = ngx.req.get_uri_args()     -- 获取参数
  14.                 if args["jump"] == "1" then
  15.                     return ngx.redirect("http://baidu.com")
  16.                 elseif args["jump"]=="2" then
  17.                     return ngx.redirect("/jump_here")       -- 重定向到/jump_here
  18.                 end
  19.             }
  20.             access_by_lua_block {           -- 访问控制
  21.                 local black_list = {                --创建黑名单,但是在这里我们每次添加新的黑名单
  22.                     ["192.168.137.1"] = true        --就需要重新启动,很麻烦,因此我们选择使用数据库-redis
  23.                 }
  24.                 if black_list[ngx.var.remote_addr] then
  25.                     ngx.exit(403)
  26.                 end
  27.             }
  28.             content_by_lua_block {          -- 内容生成器
  29.                 ngx.say("hello", "\t", ngx.var.remote_addr)
  30.             }
  31.         }
  32.         location /jump_here{
  33.             content_by_lua_block {
  34.                 ngx.say("jump_here", "\t", ngx.var.remote_addr)
  35.             }
  36.             body_filter_by_lua_block {          --修改body的内容
  37.                 local chunk = ngx.arg[1]
  38.                 ngx.arg[1] = chunk:gsub("jump_here", "xinqingpu")
  39.             }
  40.             log_by_lua_block {
  41.                 local request_method = ngx.var.request_method
  42.                 local request_uri = ngx.var.request_uri
  43.                 local msg = string.format("request_method:%s\trequest_uri:%s", request_method, request_uri)
  44.                 ngx.log(ngx.INFO,msg)        --输出到日志中去
  45.             }
  46.         }
  47.         location /back1 {
  48.             access_by_lua_file ./appp/back1.lua;   --加载我们自己写的文件:黑名单文件
  49.             content_by_lua_block {
  50.                 ngx.say("back1", "\t", ngx.var.remote_addr)
  51.             }
  52.         }
  53.         location /back2 {
  54.             access_by_lua_file ./appp/back2.lua;  
  55.             content_by_lua_block {
  56.                 ngx.say("back2", "\t", ngx.var.remote_addr)
  57.             }
  58.         }
  59.     }
  60. }
复制代码
2:美满黑名单的功能

        由于上面的黑名单非常垃圾,所以我们接纳数据库:redis的方式。我们将黑名单存储到数据库中,这样我们就不需要重新启动了,但是还有一个题目,就是我们每次访问都需要加载数据库,会很浪费时间,以及影响性能。
  1. --这个模块是使用Redis的,这样只需要我们将黑名单的参数添加到redis中即可,不用重启了
  2. local redis = require "resty.redis" --加载Redis的模块
  3. local red = redis:new() --创建一个Redis对象
  4. local ok ,err = red:connect("127.0.0.1",6379) --连接Redis
  5. if not ok then
  6.     return ngx.exit(301)        --exit里面的参数只要大于200,就会被nginx认为是错误的,会打断全部的断点。
  7. end                             --而小于200只会打断当前所在的断点。
  8. --断点就是跳出当前的运行位置,如果全部打断,那就打断全部的阶段,打断一个的话,跳出当前的阶段进入到下一个中,因为有11个阶段
  9. local ip = ngx.var.remote_addr
  10. local exists,err = red:sismember("black_list",ip)  --访问哪个表,传入参数
  11. if exists == 1 then             --在黑名单中
  12.     return ngx.exit(403)
  13. end
复制代码
3:使用共享内存完美解决

        由于nginx运行在共享内存中,所以我们把数据也存到共享内存中,提高速度,并淘汰redis的访问次数。
  1. --这个模块在开始的时候就加载了
  2. if ngx.worker.id() ~= 0 then        --在这里我们要先判断worker的数量,因为在这个位置我们还没将master进行fork,所以work的数量为0
  3.     return                            --我们指的当前位置是在11个阶段当中的位置
  4. end
  5. local redis = require "resty.redis"
  6. local bklist = ngx.shared.bklist                --加载一下共享内存
  7. local function update_blacklist()               --更新黑名单,我们这里是使用共享内存访问redis,每几秒刷新一下。
  8.     local red = redis:new()
  9.     local ok, err = red:connect("127.0.0.1", 6379)
  10.     if not ok then
  11.         return
  12.     end
  13.     local black_list,err = red:smembers("black_list")
  14.     bklist:flush_all()                          --先清空一下共享内存
  15.     for _, v in pairs(black_list) do            --加载共享内存
  16.         bklist:set(v, true)
  17.     end
  18.     ngx.timer.at(5, update_blacklist)           --每5秒刷新一次,将此函数加载到ngx的定时器中。
  19. end
  20. ngx.timer.at(5, update_blacklist)               --开始调用
复制代码
 我们调用的是下面的函数库,上面的是用来初始化全部的worker进程的。
  1. local bklist = ngx.shared.bklist
  2. local ip = ngx.var.remote_addr
  3. if bklist:get(ip) then          --如果我们的ip被查到在黑名单中就报错
  4.     return ngx.exit(403)
  5. end
复制代码
 五:实现负载平衡

        我们还可以使用openresty来实现负载平衡,其中我们先使用最简单的方式,也就是手写需要转发的ip地址,然后下面需要我们使用lua代码动态加载服务器或者转发的地址。
  1. worker_processes 4;
  2. events {
  3.   worker_connections 1024;
  4. }
  5. http {
  6.     error_log ./logs/error.log info;
  7.    
  8.     upstream ups {
  9.         server 192.168.137.132:8100;        --他的后面还是别的服务器
  10.         server 192.168.137.132:8200;
  11.         server 192.168.137.132:8300;
  12.     }
  13.     server {
  14.         listen 8999;
  15.         location / {
  16.             proxy_pass http://ups;
  17.         }
  18.     }
  19. }
  20. #下面全都是tcp裸连接
  21. stream {
  22.     upstream tcp_ups {
  23.         server 127.0.0.1:8888;        --我们可以把我们需要连接的服务器,放在这里,我们通过tcp进行连接这里,会连接到我们需要的服务器。
  24.     }
  25.     server {
  26.         listen 9000;
  27.         proxy_pass tcp_ups;
  28.         proxy_protocol on;            --我们采用这个,实现ip地址的保留
  29.     }
  30. #为了更加方便的添加转发服务器,我们将服务器放到数据库中
  31.     server {
  32.         listen 9001;
  33.         content_by_lua_file ./app/proxy.lua;    --这里是动态加载我们的服务器
  34.     }
  35. }
复制代码
 下面的代码是我们转发过来的地址,我们会接收转发过来的ip地址。我们会发现ip地址丢失了。这里的丢失是我们客户端的ip丢失了。
  1. worker_processes 4;
  2. events {
  3.   worker_connections 1024;
  4. }
  5. http {
  6.     error_log ./logs/error2.log info;
  7.     server {
  8.         listen 8100;
  9.         location / {
  10.             content_by_lua_block {
  11.                 local headers = ngx.req.get_headers()
  12.                 local cjson = require "cjson"
  13.                 ngx.say(cjson.encode(headers))
  14.                 ngx.say(8100,"\t",ngx.var.remote_addr)
  15.             }
  16.         }
  17.     }
  18.     server {
  19.         listen 8200;
  20.         location / {
  21.             content_by_lua_block {
  22.                 local headers = ngx.req.get_headers()
  23.                 local cjson = require "cjson"
  24.                 ngx.say(cjson.encode(headers))
  25.                 ngx.say(8200,"\t",ngx.var.remote_addr)
  26.             }
  27.         }
  28.     }
  29.     server {
  30.         listen 8300;
  31.         location / {
  32.             content_by_lua_block {
  33.                 local headers = ngx.req.get_headers()
  34.                 local cjson = require "cjson"
  35.                 ngx.say(cjson.encode(headers))
  36.                 ngx.say(8300,"\t",ngx.var.remote_addr)
  37.             }
  38.         }
  39.     }
  40. }
复制代码
        下面就是我们lua的代码了,我们可以动态的加载不同的服务器了,不需要我们手动写道openresty中了,而且我们通过这个代码,还可以做到保留原客户端的ip地址不丢失。
  1. --这里的nginx既有服务端也有客户端的性质,所以有两个套接字,一个用于连接redis,一个用于接收客户端的数据
  2. local sock, err = ngx.req.socket()          --创建nginx的套接字,用来连接redis
  3. if err then
  4.     ngx.log(ngx.INFO, err)
  5. end
  6. local upsock, ok
  7. upsock = ngx.socket.tcp()                   --创建客户端连接上来的套接字,客户端是tcp,所以这里也是tcp的套接字
  8. ok, err = upsock:connect("127.0.0.1", 8989)     --这里是redis的端口,通过tcp套接字来连接这个redis。
  9. if not ok then
  10.     ngx.log(ngx.INFO, "connect error:"..err)
  11. end
  12. upsock:send(ngx.var.remote_addr .. '\n')            --由于会丢失ip,我们在这里写下客户端源地址,并发送给redis
  13. local function handle_upstream()
  14.     local data
  15.     for i=1, 1000 do
  16.         local reader = upsock:receiveuntil("\n", {inclusive = true})        --全都是存的服务器
  17.         data, err, _ = reader()
  18.         if err then
  19.             sock:close()
  20.             upsock:close()
  21.             return
  22.         end
  23.         sock:send(data)         --我们从redis中获取一个服务器,然后我们向这个服务器发送数据。      
  24.     end
  25. end
  26. ngx.thread.spawn(handle_upstream)       --创建线程,后台运行这个函数
  27. local data
  28. while true do
  29.     local reader = sock:receiveuntil("\n", {inclusive = true})
  30.     data, err, _ = reader()
  31.     if err then
  32.         sock:close()
  33.         upsock:close()
  34.         return
  35.     end
  36.     upsock:send(data)               --这里是一直接收客户端连接nginx的数据,然后再将收到的数据再发送给客户端。回报文。
  37. end
  38. --实现了一个简单的代理功能,用于在 Nginx 服务器和 Redis 服务器之间转发数据。它使用了 Nginx 的 Lua 模块和 Lua 的套接字库来实现网络通信。
复制代码
        本文解说的是Openresty,其中主要是Lua的使用,重新定向,黑名单,负载平衡,对于我本人来说,对于nginx写一些模块并没有使用openresty方便,由于nginx需要使用c语言来写,然后加载动态库等等,它可以直接使用lua进行编程,非常方便。0voice · GitHub

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4