Eagle

基于flink和drools的实时日志处理

橙三吉。 提交于 2020-10-14 01:01:25
1、背景 日志系统接入的日志种类多、格式复杂多样,主流的有以下几种日志: filebeat采集到的文本日志,格式多样 winbeat采集到的操作系统日志 设备上报到logstash的syslog日志 接入到kafka的业务日志 以上通过各种渠道接入的日志,存在2个主要的问题: 格式不统一、不规范、标准化不够 如何从各类日志中提取出用户关心的指标,挖掘更多的业务价值 为了解决上面2个问题,我们基于flink和drools规则引擎做了实时的日志处理服务。 2、系统架构 架构比较简单,架构图如下: 各类日志都是通过kafka汇总,做日志中转。 flink消费kafka的数据,同时通过API调用拉取drools规则引擎,对日志做解析处理后,将解析后的数据存储到Elasticsearch中,用于日志的搜索和分析等业务。 为了监控日志解析的实时状态,flink会将日志处理的统计数据,如每分钟处理的日志量,每种日志从各个机器IP来的日志量写到Redis中,用于监控统计。 3、模块介绍 系统项目命名为eagle。 eagle-api:基于springboot,作为drools规则引擎的写入和读取API服务。 eagle-common:通用类模块。 eagle-log:基于flink的日志处理服务。 重点讲一下eagle-log: 对接kafka、ES和Redis 对接kafka和ES都比较简单

Kafka学习笔记

我怕爱的太早我们不能终老 提交于 2020-10-07 04:38:44
教学视频 本文用到的源码 Kafka学习资料 链接: https://pan.baidu.com/s/1oHYCvHZ4Uanll1Bj3v-3Hw 提取码:5afq - - - 01.Kafka入门_课程介绍 02.Kafka入门_定义 03.Kafka入门_消息队列 04.Kafka入门_消费模式 05.Kafka入门_基础架构 06.Kafka入门_安装&启动&关闭 07.Kafka入门_命令行操作Topic增删查 08.Kafka入门_命令行控制台生产者消费者测试 09.Kafka入门_数据日志分离 10.Kafka入门_回顾 11.Kafka高级_工作流程 12.Kafka高级_文件存储 13.Kafka高级_生产者分区策略 14.Kafka高级_生产者ISR 15.Kafka高级_生产者ACk机制 16.Kafka高级_数据一致性问题 17.Kafka高级_ExactlyOnce 18.Kafka高级_生产者总结 19.Kafka高级_消费者分区分配策略 20.Kafka高级_消费者offset的存储 21.Kafka高级_消费者组案例 22.Kafka高级_高效读写&ZK作用 23.Kafka高级_Ranger分区再分析 24.Kafka高级_事务 25.Kafka高级_API生产者流程 26.Kafka高级_异步发送API普通生产者 27.Kafka高级_回顾 28

Smartbi成功入选Gartner增强数据分析2020代表厂商!

混江龙づ霸主 提交于 2020-09-30 07:38:29
近日,全球权威的顾问咨询公司Gartner发布《Hype Cycle for ICT in China, 2020》报告(2020年中国ICT技术成熟度曲线报告),思迈特软件Smartbi作为国内极具实力的BI厂商,凭借Smartbi Eagle自助数据分析平台,入选增强数据分析代表厂商(Augmented Data and Analytics Sample Vendor)。 技术成熟度曲线是Gartner为企业提供的评估新技术成熟度的典型工具,主要用来帮助客户跟踪技术的成熟度和未来潜力。从Gartner发布的2020技术成熟度曲线上可以看出,增强数据分析技术正处于“技术萌芽期”。在这个阶段,企业开始有这方面的技术需求,一批拥有探索精神的厂商不断研发实践, 整个市场处于“蓄势待发”的状态。此次Smartbi成功入选Gartner增强数据分析代表厂商,是市场对Smartbi的认可和肯定。 01 Gartner 对增强数据分析的解读 报告认为,增强数据分析包括机器学习(ML)和人工智能(AI),在统一的平台上提供数据管理和分析能力。它通过将ML和AI应用于现有的操作流程中,使数据管理和分析自动化,从而更有效地进行数据分析。它使更多的用户获得更深入的洞察力,减少了当前依赖IT处理所带来的效率问题和口径偏差。 使用ML和AI是数据分析的增强工作,而不是要取代它。国内的整体数据素养仍然比较低

GitHub 全域数字年报:携手推动开源世界的超级协作

给你一囗甜甜゛ 提交于 2020-09-29 13:49:06
2020年1月24日,Wuhan2020开源项目正式发起,在疫情期间累积吸引到了约 3000余位 技术志愿者以及近 1000余位 非技术志愿者在线上开展志愿行动与参与。 Wuhan2020 在成立后的约 3个 月时间内,通过开源协作的方式在互联网上开展志愿者支持与工作协同,搭建起了 5个 网站/App, 23个 Github代码仓库,通过一手采集和二手整理,收录了与抗击新冠疫情相关的各类信息近 5000条 ,网站页面收获了 30余万次 点击(截至当时5月);其允许公开读取使用的数据信息集合促成了牛津剑桥校友援助会提供的武汉社区及周边地区医院和社区数据对接、硅谷的Gliding Eagle团队及美国一家全球医疗信息服务平台的医疗物资援助等案例达成。 开放式自组织协作取得的一小点成绩,却让我们看到了人类的未来。 然而,当下的世界环境却不容乐观,在新冠疫情的施虐下,世界似乎正在走向割裂与纷争。物理世界的隔离似乎开始蔓延到整个人类的社会与经济中,数字世界也开始收到冲击。 人类的进步无法阻挡,就像著名实验心理学家、认知心理学家和科普作家 史蒂芬·平克(Steven Pinker) 在 《当下的启蒙》 中所指出的那样: 启蒙运动的理念是人类理性的产物,它们总是与人性的其他方面相互斗争;理性是不容商榷的,人类一定会在协作中获得演化进步;如果你不得不盲目地选择自己想要出生的年代,你最好选择现在。

First Eagle时隔80多年后开设德国第一家办事处;新聘任的Louanges将在慕尼黑管理国际批发业务

假如想象 提交于 2020-08-19 19:11:57
纽约--(美国商业资讯)--First Eagle Investment Management, LLC (“First Eagle”)欣然宣布其将在德国慕尼黑开设分支机构First Eagle Investment Management Ltd.的计划,借此该公司将为其欧洲、中东和非洲(EMEA)以及其他非美国住所的国际批发客户提供服务。慕尼黑办事处将由Matthieu Louanges管理,他将于8月3日加入First Eagle,担任其国际批发业务主管。 Louanges将进驻慕尼黑,为计划在2020年年底正式在慕尼黑开设First Eagle办事处做准备。 此新闻稿包含多媒体内容。完整新闻稿可在以下网址查阅: https://www.businesswire.com/news/home/20200803005114/en/ First Eagle总裁兼首席执行官Mehdi Mahmud表示:“First Eagle的起源可追溯到德国,在离开80多年后,我们在德国重新建立起本地业务。First Eagle的前身公司Arnhold and S. Bleichroeder是由两家著名的德国银行合并而成的,它们分别是成立于1803年、总部位于柏林的S. Bleichroeder和成立于1864年、总部位于德累斯顿的Gebr. Arnhold。First Eagle在欧洲扎根很深

自助分析平台哪个比较好?

孤者浪人 提交于 2020-08-19 02:58:01
自助式BI 或者自助式数据分析是最近几年兴起的一个概念。根据Gartner发布的信息,Self Service BusinessIntelligence(SSBI)被定义为“终端用户在被批准和支持的平台或工具组合中设计和部署自己的报告和分析。 很多业内人士都表示未来的BI或者数据分析的趋势就是要实现去中心化。以前有三类人需要牵涉到整个BI系统的环境或者是业务的搭建过程中(ETL, 数据分析及可视化,业务人员)。去中心化就是企业不再需要有一个专门的BI部门去完成整个业务的需求,而是业务部门的人员需要参与到数据分析及可视化的日常工作中间去,利用一个平台或者工具能够实时地满足自己的分析需求。也早已有很多自助式分析的工具已经发展起来。使用方便、界面分析DIY、学习成本低是它区别于传统工具的特性,像我们常见的Tableau、Smartbi、PowerBI 等数据分析软件。来自Tableau的预测未来的几年之内这种模式的工具和概念将会覆盖大多数的数据分析应用场景,自助式数据分析时代正在来临。 不过有一些行业专家却对此表示不一样的看法。Rob Wunderlich是知名的产品应用大师,他有很多开创性的技术文章为广大的开发人员解决了大量难题。他曾就到底什么是自助式BI提出过一些观点。他认为,BI的目标是为业务提供答案和见解并支持决策, 这些答案来自于与内容的交互,而不是创建内容。我不认为一个

基于flink和drools的实时日志处理

↘锁芯ラ 提交于 2020-08-16 03:38:39
1、背景 日志系统接入的日志种类多、格式复杂多样,主流的有以下几种日志: filebeat采集到的文本日志,格式多样 winbeat采集到的操作系统日志 设备上报到logstash的syslog日志 接入到kafka的业务日志 以上通过各种渠道接入的日志,存在2个主要的问题: 格式不统一、不规范、标准化不够 如何从各类日志中提取出用户关心的指标,挖掘更多的业务价值 为了解决上面2个问题,我们基于flink和drools规则引擎做了实时的日志处理服务。 2、系统架构 架构比较简单,架构图如下: 各类日志都是通过kafka汇总,做日志中转。 flink消费kafka的数据,同时通过API调用拉取drools规则引擎,对日志做解析处理后,将解析后的数据存储到Elasticsearch中,用于日志的搜索和分析等业务。 为了监控日志解析的实时状态,flink会将日志处理的统计数据,如每分钟处理的日志量,每种日志从各个机器IP来的日志量写到Redis中,用于监控统计。 3、模块介绍 系统项目命名为eagle。 eagle-api:基于springboot,作为drools规则引擎的写入和读取API服务。 eagle-common:通用类模块。 eagle-log:基于flink的日志处理服务。 重点讲一下eagle-log: 对接kafka、ES和Redis 对接kafka和ES都比较简单

Hacker News 简讯 2020-07-24

三世轮回 提交于 2020-08-14 13:37:32
最后更新时间: 2020-07-24 22:01 Editorial board of Index and more than 70 staff members resign - (index.hu) 《索引》编辑部和70多名员工辞职 得分:196 | 评论:52 The Four Quadrants of Conformism - (paulgraham.com) 墨守成规的四个象限 得分:193 | 评论:218 FAA issues emergency directive on 2,000 Boeing 737 NG Classic planes - (reuters.com) 美国联邦航空局对2000架波音737 NG经典飞机发布紧急指令 得分:37 | 评论:16 Show HN: How I made simple Geolocation service which handles 6m+ req/mo for $5 - (maxkostinevich.com) 演示HN:我是如何制作简单的地理定位服务的,它能以5美元的价格处理6个月以上的申请/月 得分:248 | 评论:108 Cold Showers: For when people get too hyped up about things - (github.com) 冷水澡:当人们对事情过于兴奋时 得分

10 分钟快速上手 Shiro 新手教程

旧城冷巷雨未停 提交于 2020-08-11 06:24:58
当前用户 现在我们能够开始做一些我们真正关心的事情——执行安全操作。 当保护我们的应用程序时,我们对自己可能提出的最为相关的问题是“当前用户是谁”或“当前用户是否被允许做XXX”。 当我们编写代码或设计用户接口时,问这些问题是很常见的:应用程序通常是基于用户的背景情况建立的,且你想基于每个用户标准体现(保障)功能。因此,对于我们考虑应用程序安全的最自然的方式是基于当前用户。 Shiro的API使用它的Subject概念从根本上代表了“当前用户”的概念。 几乎在所有的环境中,你可以通过下面的调用获取当前正在执行的用户: Subject currentUser = SecurityUtils.getSubject(); 使用 SecurityUtils.getSubject(),我们可以获得当前正在执行的Subject。Subject是一个安全术语,它基本上的意思是“当前正在执行的用户的特定的安全视图”。它并没有被称为"User"是因为"User"一词通常和人类相关联。 在安全界,术语"Subject"可以表示为人类,而且可是第三方进程,cron job,daemonaccount,或其他类似的东西。它仅仅意味着“该事物目前正与软件交互”。 对于大多数的意图和目的,你可以把 Subject 看成是 Shiro 的"User"概念。 getSubject()在一个独立的应用程序中调用

bi软件是做什么用的?

☆樱花仙子☆ 提交于 2020-08-06 11:53:48
BI软件是商业智能(Business Intelligence)软件的英文缩写。目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。商务智能系统中的数据来自企业其他业务系统。例如商贸型企业,其商务智能系统数据包括业务系统的订单、库存、交易账目、客户和供应商信息等,以及企业所处行业和竞争对手的数据、其他外部环境数据。而这些数据可能来自企业的CRM、SCM、进销存等业务系统。 今天小麦从数据连接、数据处理、制作报表、自助分析、数据共享等方面,和大家探讨下BI软件具体能做什么呢? 一、BI软件可以连接不同各种数据库和文件的数据。 众所周知,无论是制作报表进行数据可视化还是挖掘数据更深次的内涵,获取数据是企业进行一切数据分析的前提。数据是不断更新的,目前实际大部分企业是将数据存储在数据库中,使用数据库数据来制作报表,并且报表内容会随着数据库的更新而更新。而数据分析工具则是通过数据连接来建立与各种数据库、文件到系统的连接,为后续处理和分析提供数据支持,所以数据连接则是数据分析软件不可或缺的能力。 Smartbi能打通各类数据源,丰富的数据连接能力能够从各种数据源中抓取数据进行分析,除了支持大家常用的oracle、sqlserver、mysql等关系型数据库,各种主流大数据库、非关系型数据库、多维数据库、本地文件如:excel、txt、csv