kafka使用总结

发表于 2020-09-02 | 分类于学习

简介

Kafka 是一种高吞吐量、分布式、基于发布/订阅的消息系统，最初由 LinkedIn 公司开发，使用
Scala 语言编写，目前是 Apache 的开源项目。

阅读全文 »

Zookeeper使用总结

发表于 2020-09-02 | 分类于学习

面试官：工作中使用过Zookeeper嘛？你知道它是什么，有什么用途呢？

有使用过的，使用ZooKeeper作为dubbo的注册中心，使用ZooKeeper实现分布式锁。
ZooKeeper，它是一个开放源码的分布式协调服务，它是一个集群的管理者，它将简单易用的接口提供给用户。
可以基于Zookeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、分布式锁和分布式队列等功能。
Zookeeper的用途：命名服务、配置管理、集群管理、分布式锁、队列管理

用途跟功能不是一个意思咩？给我一个眼神，让我自己体会

阅读全文 »

Zookeeper使用实例——服务节点管理

发表于 2020-08-30 | 更新于 2020-09-02 | 分类于学习

分布式处理中，总会存在多个服务节点同时工作，并且节点数量会随着网络规模的变化而动态增减，服务节点也有可能发生宕机与恢复。面对着动态增减的服务节点，我们如何保证客户请求被服务器正确处理呢。我们可以通过zookeeper临时节点创建与自动删除来掌握服务节点的动态增减。

阅读全文 »

Flink Table 的三种 Sink 模式

发表于 2020-08-09 | 更新于 2020-08-10 | 分类于学习

Flink简介

作为计算引擎 Flink 应用的计算结果总要以某种方式输出，比如调试阶段的打印到控制台或者生产阶段的写到数据库。而对于本来就需要在 Flink 内存保存中间及最终计算结果的应用来说，比如进行聚合统计的应用，输出结果便是将内存中的结果同步到外部。就 Flink Table/SQL API 而言，这里的同步会有三种模式，分别是 Append、Upsert 和 Retract。实际上这些输出计算结果的模式并不限于某个计算框架，比如 Storm、Spark 或者 Flink DataStream 都可以应用这些模式，不过 Flink Table/SQL 已有完整的概念和内置实现，更方便讨论。

阅读全文 »

Linux常用命令

发表于 2019-04-22 | 更新于 2019-04-26 | 分类于学习

最近都在和Linux打交道，我觉得Linux相比windows比较麻烦的就是很多东西都要用命令来控制，当然，这也是很多人喜欢Linux的原因，比较短小但却功能强大。

阅读全文 »

hexo博客搭建

发表于 2019-04-16 | 更新于 2019-04-28 | 分类于博客

简介

最近一段时间比较闲，想着搭个博客玩玩，看了网上主流的博客网站，不是太喜欢，作为一个互联网行业的小渣渣，博客当然要自己搭才有意思了，于是在网上找了一些方案，最终选择了hexo+github的方式来搭建个人博客。

阅读全文 »

Ocean

大数据技术博客

GitHub 邮箱