手把手用 UDP 实现 Node 服务日志归集(附完整源码)

喜欢而已 提交于 2020-07-27 09:05:47

日志归集:顾名思义,就是把日志归集起来。

在开发 Node 服务的时候,我们经常会打印各种日志,比如 info, error 日志。

如果我们已经将服务已经部署了很多机器上,这个时候如果需要查询昵称为”张三“的日志流水,那就很痛苦了,机器越多越难搞,因为不知道昵称为”张三“的日志流水到底在哪一台,甚至可能还分散在多台服务器。

因此,我们需要做日志归集,这样我们在一台机器上就可以查看所有的日志了。

本文目录:

  • 使用 dgram 实现日志归集
  • UDP 数据包 和 Unix 数据报
  • 再看 dgram

第一步:收集日志

服务是部署在多台服务器上,每台机器上都会打印日志,最终我们要归集起来到一台机器上展示,那么首先需要把每台服务器上的日志拿到,一般有两种实现方式。

使用日志 logger 组件

如果整个系统日志输出,我们是使用统一的自定义 logger 组件,比如执行 logger.info(), logger.error() 来输出日志的话。那么我们就很容易收集日志了,直接在 logger 的 info , error, warn 等方法里面收集即可。

比如如下,在 logger 日志对象里面,增加存储到 logList 临时对象里面。

const logList=[];
['info','warn','error'].forEach((type)=>{
    this[type] = ()=>{
        // do something
        logList.push({type:type,data:Array.from(arguments).join(" ")});
 } }); 复制代码

这里我们需要用 logList 数组保存起来,是为了数据能批量发送,在指定的间隔时间(比如 1s),发送一次日志,而不是每执行一次 log,就需要发送一次请求。

扫描文件上报

有些使用了第三方框架,写日志,并不是经过我们自定义的 logger 组件,这个时候,我们可以采取读取文件的方式来收集日志数据。实现如下:

const fsExtra = require('fs-extra');
// 监听文件 path 的变化
fsExtra.watchFile(path, (curr, prev) => {
    // 有时候响应不稳定,会触发两次,第二次触发的时候,对象里面的时间戳会相等,所以判断当前时间戳小于等于上一次时间戳可过滤多余的监听。
    if (curr.mtime <= prev.mtime) return;
 // 为了提高性能,我们采取只读的方式来 open  fsExtra.open(path, 'r', function(error, fd) {  if (error) {  logger.error('open log error', error);  return;  }  // 创建一个缓冲,长度为(当前文件大小-文件上一个状态的大小) 由于这里我们已经明确获取到长度了,所以创建buffer可以使用性能更好的 allocUnsafe  buffer = Buffer.allocUnsafe(curr.size - prev.size);  fsExtra.read(fd, buffer, 0, (curr.size - prev.size), prev.size, function(err, bytesRead, buffer) {  if (err) {  logger.error('read log error', error);  return;  }  const data = buffer.toString();  logList.push({data:data});  });  }); 复制代码

逻辑也比较简单,监听日志文件(如果需要监听文件夹,在可以使用 watch)。当监听到文件变更的时候,已只读的方式打开文件,然后使用 read 函数读取文件的从起始到结束为止的内容。

第二步:客户端发送 UDP 数据包

UDP 数据包的特点是无连接,结构简单,对系统资源消耗少。缺点是数据不保证正确,且数据包到达先后顺序不保证。

对于我们的日志归集,显然不需要保证正确,且先后顺序影响不大,我们在每一条数据消息里面携带发送消息客户端的时间戳即可。所以我们选择 UDP 数据包。

这里到底使用 udp4 还是 udp6 ,取决于我们服务器,对应我们熟悉的是 IPV4 和 IPV6。这里使用 udp4。

const dgram = require('dgram');
const clientSocket = dgram.createSocket('udp4');
// 原创 udp 日志服务器的 ip 和 port,可能会是配置下发的方式来确定。如果是明确的一台服务器,也可以写死。
let remoteUDPServerIP = 'xxx,xxx,xxx,xxx';
let remoteUDPServerPort = 'xxx';
// 当前 udp 服务的 ip clientSocket.bind(7777); setInterval(()=>{  if(logList.length==0) return;  const data = logList.join("\r\n");  logList = [];  clientSocket.send(data, 0, data.length, remoteUDPServerPort, remoteUDPServerIP); },1000);  复制代码

开启定时器,扫描存储的日志列表。通常来说,如果我们的日志数据 logList ,是由我们自己定义的 logger 获取的,那么我们需要先用数组存起来,然后定时发送 UDP 数据包到 server 服务器上,达到批量发送的目的,减少发送频率。

但是如果我们是使用读取文件的方式来拿到需要上报的日志的话,我们可以监听到文件变化然后直接上报即可,无需使用定时器发送,因为会在写日志文件的时候,已经做了批量写入了(一般会是 1s 更新一次)。

第三步:服务器接受 UDP 数据包

使用 dgram 创建服务端,然后接受客户端发送的消息,最终写到统一的日志文件里面。

const path = require("path");
const fsExtra = require('fs-extra');
const dgram = require('dgram');
const serverSocket = dgram.createSocket('udp4');

serverSocket.on('message', function(msg, rinfo){  handleMsg(msg,rinfo.address); }); // 服务端端口 serverSocket.bind(7777);  var fp = "./logs"+path.sep+path.sep+msg.type; fsExtra.ensureDir(fp);  function handleMsg(msg,address){  try{  msg = typeof msg=="object"?JSON.parse(msg):{msg:msg};  }catch(e){  console.log(e);  }  if(!msg.type) msg.type="info";   // 组装上报参数  let filepath = fp+path.sep+ getDate()+".log";  let content = [];  content.push(getDate(true));  content.push(address);  content.push(typeof msg.msg=="object"?JSON.stringify(msg.msg):msg.msg);  content.push('\r\n');  // 写入日志文件  fs.appendFile(filepath, content.join(" "), err=> {  if(err){  fs.appendFile(".logs/white-error.log", filepath+"\t"+msg, e=>{});  }else{  // report   }  }); } function getDate(time) {  let date = new Date();  if(time){  let hour = date.getHours();  let minute = date.getMinutes();  let second = date.getSeconds();  let miseconds = date.getMilliseconds();  return [hour, minute, second,miseconds].map(formatNumber).join(':');  }  let year = date.getFullYear();  let month = date.getMonth() + 1;  let day = date.getDate();  let p = [year, month, day].map(formatNumber).join('-');  return p; } function formatNumber(n) {  n = n.toString();  return n[1] ? n : '0' + n; } 复制代码

这里大伙看下应该能看懂了。创建 7777 端口的服务。然后监听到消息,则立即写入文件。

第四步:查询日志

至此,我们就实现了一个简单的 UDP 数据包的日志归集功能。不管部署多少台服务器。我们只需要在 ./logs/ 目录下就可以查看日志了。执行 tail 命令就可以查看各个服务器归集过来的日志了,当然时间可能会有错乱,但是以每条消息的时间为准即可。

 $ tail -f logs/info/2020-04-19.log
复制代码

UDP 数据包 和 Unix domain socket 数据报

UDP,全称 User Datagram Protocol, 即用户数据报协议。UDP 和 TCP 两者的具体差异就不罗列了,有兴趣可以去了解下。主要差异如下:

udp

这里我们主要看和 unix 协议的差异。

Unix domain socket(UDS):是 unix 服务器进程之间本地通信 IPC 的一种。提供了两套协议:字节流套接口(类似 TCP )和数据报套接口(类似 UDP )。

unix 数据报套接口与 UDP 的区别主要在于 UDS 只能做本机 IPC, 而 UDP 可以是本机也可以是远程机器通信。

如果仅仅是本机通信的话,推荐直接使用 UDS。主要优势有以下两个:

  • UDS 协议的数据报不会出现丢失乱序的情况。
  • UDS 协议性能更优,不会跑到链路层,不会做数据报校验。

当然如果为了可扩展,后续迁移到不同的机器,也可以使用 UDP 来实现。

UDS 协议可以使用 Node 的 unix-dgram 组件来实现。

由于 UDS 是本机通信,所以不需要端口和 IP, 直接使用文件系统表示的路径名来标识。比如 /path/to/socket 这个系统路径。如果需要创建多个 server, 则指定不同的路径即可。我们来看下具体的使用代码。

服务接收端:

const unix = require('unix-dgram');
const server = unix.createSocket('unix_dgram', function(buf) {
  console.log('received ' + buf);
});
server.bind('/path/to/socket');
复制代码

客户发送端:

const message = Buffer('ping');
const client = unix.createSocket('unix_dgram');
client.send(message, 0, message.length, '/path/to/socket');
复制代码

也可以自行定义其他 EventsListener,

const unix = require('unix-dgram');
const client = unix.createSocket('unix_dgram');
client.on('error', function(err) {
    console.error(err);
});
client.on('connect', function() {  console.log('connected');  client.on('congestion', function() {  /* The server is not accepting data */  });  client.on('writable', function() {  /* The server can accept data */  });  var message = new Buffer('ping');  client.send(message); }); client.connect('/tmp/server'); 复制代码

使用方式还是比较简单的,相信大伙看看就能懂了。

再看 dgram

dgram 是 Nodejs 提供的用于发送 UDP 数据报的模块。

dgram 提供了非常丰富的 api,可以参考文档:nodejs.cn/api/dgram.h…;

主要功能是可以实现 ”单播”、“广播”和“组播”消息。

单播

单播即单向通信,客户端向服务端发送消息,本文中的日志归集就是单播实现。参考上面实现。

广播

广播顾名思义,就是广撒网,非点对点通信。把数据发送给本地子网上的所有的机器,即广播。要实现广播,首先要获取到广播地址。比如我在终端输入:ifconfig,如下显示的 broadcast 就是广播地址。

broadcast

知道了广播地址,则可以在服务端向子网内所有机器发送广播消息了。

const dgram = require("dgram");
const serverUDP = dgram.createSocket("udp4");
serverUDP.on("listening", () => {
    console.log("socket正在监听...");
    server.setBroadcast(true);
 server.setTTL(64);  setTimout(() => {  server.send("大家好啊,我是服务端.", 7778, "192.168.0.255")  }, 1000) }) serverUDP.on("message", (msg, rinfo) => {  console.log(`msg from client ${rinfo.address}:${rinfo.port}`); }) server.bind(7777); 复制代码

这里我创建了一个服务端,监听 7777 端口。向广播地址:192.168.0.255 端口为 7778 的所有客户端发送广播消息,于是属于同一个广播区域段的客户端的 7778 端口都会收到服务端的消息。

默认是单播,需要广播消息,设置 setBroadcast 为 true 即可。

IP_TTL : 表示存活时间,每经过个路由器或者网关都会减少 TTL 数值,如果 TTL 被一个路由器减少到 0,这个数据报将不会继续转发。

组播

组播报文的目的地址使用D类IP地址, D类地址不能出现在IP报文的源IP地址字段。

224.0.0.0~224.0.0.255为预留的组播地址(永久组地址),地址224.0.0.0保留不做分配,其它地址供路由协议使用; 224.0.1.0~224.0.1.255是公用组播地址,可以用于Internet; 224.0.2.0~238.255.255.255为用户可用的组播地址(临时组地址),全网范围内有效; 239.0.0.0~239.255.255.255为本地管理组播地址,仅在特定的本地范围内有效。

下面已 224.1.1.1 组播地址测试。其他代码通广播。

服务端:

const addr = '224.1.1.1';
server.on("listening",()=>{
    console.log("socket正在监听中.....");
    server.addMembership(addr);
    server.setMulticastTTL(64);
 setTimout(()=>{  server.send('大家好啊,我是服务端.',7778,addr);  },1000) }) 复制代码

客户端:

const dgram = require("dgram");
const client = dgram.createSocket("udp4");
const addr = '224.1.1.1';
client.on("listening", () => {
    console.log("socket正在监听...");
 client.addMembership(addr); }) client.on("message", (msg, rinfo) => {  console.log(`msg from server:${msg},addr:${rinfo.address}`); }) client.bind(7778) 复制代码

到此为止,简易的日志服务系统已经开放完成,在实际中,我们可能不会直接这样使用,一般有两种方式:

  • 使用自研的 node 框架或者统一的日志组件,然后由框架容器或者组件去实现所有的日志收集,上报和展示。
  • 使用统一的日志服务,比如 c++ 开发的日志服务,按照配置和设定的规则,统一收集日志信息,上报和展示。

对于业务开发者来说,可能就只需要在项目里面配置下,就能享受流畅的日志查看了。

然而我们只有在工作中跳出仅仅作为使用者的角度,去探索各个系统的实现原理,这样才能游刃有余。

源码 https://github.com/antiter/udp-log

欢迎关注我的微信公众号,一起做靠谱前端!

follow-me
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!