学习大数据

学习大数据

Kafka基本使用
Created2026-03-15|kafka
查看操作主题命令参数1[zhangan@node1 kafka]$ bin/kafka-topics.sh 参数 描述 –bootstrap-server <String: server toconnect to> 连接的Kafka Broker主机名称和端口号。 –topic <String: topic> 操作的topic名称。 –create 创建主题。 –delete 删除主题。 –alter 修改主题。 –list 查看所有主题。 –describe 查看主题详细描述。 –partitions <Integer: # of partitions> 设置分区数。 –replication-factor<Integer: replication factor> 设置分区副本。 –config <String: name=value> 更新系统默认的配置。 查看当前服务器中的所有topic1[zhangan@node1 kafka]$ bin/kafk...
Flink Hello World
Created2026-03-14|Flink
pom1234567891011121314151617<!-- Flink 核心依赖 --><dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-java</artifactId> <version>${flink.version}</version></dependency><dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-streaming-java</artifactId> <version>${flink.version}</version></dependency><!-- Flink 客户端依赖(本地运行需要) -->...
Flink Stream Connect
Created2026-03-14|Flink
一、Flink Connect 操作核心说明Flink 的 connect 是比 union 更灵活的流合并操作: union:仅能合并同数据类型的多个流,合并后仍是同类型流; connect:可以合并不同数据类型的两个流,合并后得到 ConnectedStreams,需通过 CoMapFunction/CoFlatMapFunction 分别处理两种类型的数据。 二、流程图12345678flowchart LR A[数据源1] --> B[stringStream<br/>数据类型:String] C[数据源2] --> D[intStream<br/>数据类型:Integer] B --> E[connect 操作<br/>合并不同类型流] D --> E E --> F[CoMapFunction<br/>map1:处理String<br/>map2:处理Integer] F --> G[resultStream<br/&...
Flink Stream Union
Created2026-03-14|Flink
一、流程图1234567flowchart LR A[数据源1] --> B[stream1<br/>数据类型:String] C[数据源2] --> D[stream2<br/>数据类型:String] B --> E[union 操作<br/>合并同类型流] D --> E E --> F[unionStream<br/>合并后的数据流] F --> G[打印/下游处理] 二、Flink Union 操作实现代码首先为你提供可直接运行的 Flink 代码示例,实现两个流(stream1、stream2)的 Union 操作,代码基于 Flink 1.16+ 版本: 12345678910111213141516171819202122232425262728import org.apache.flink.api.common.typeinfo.Types;import org.apache.flink.streaming.api.datastream.Da...
Flink Introduction
Created2026-03-14|Flink
Flink版本1<flink.version>1.16.1</flink.version>
Flink WordCount
Created2026-03-14|Flink
Flink WordCount输入1234yuan@ThinkPad:~$ nc -lk 9999ab bc c c 输出123456(a,1)(b,1)(b,2)(c,1)(c,2)(c,3) wordcount1234567891011121314151617181920// 3. 数据处理:单词计数DataStream<Tuple2<String, Integer>> wordCountStream = socketSource // 拆分每行输入为单个单词,并初始化为 (单词, 1) .flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() { @Override public void flatMap(String line, Collector<Tuple2<String, Integer>> out) throws Exception ...
Flink Kafka
Created2026-03-14|Flink
pom12345<dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-kafka</artifactId> <version>${flink.version}</version></dependency> Kafka命令行创建Topic12(base) [zhangsan@node1 ~]$ kafka-topics.sh --create --topic flink-kafka --partitions 3 --replication-factor 2 --bootstrap-server node1:9092Created topic flink-kafka. 生产者12345(base) [zhangsan@node1 ~]$ kafka-console-producer.sh --topic flink-kafka --boot...
Flink Table API - CSV
Created2026-03-14|Flink
Apache Flink 的 Table API 是一种用于流处理和批处理的统一的关系型 API。它允许用户以声明式的方式编写查询,类似于 SQL,但可以无缝地集成到 Flink 程序中。以下是一个入门示例,演示如何使用 Table API 读取 CSV 文件、进行简单的聚合计算并将结果输出到控制台。 引入依赖在开始之前,确保你的项目中包含了必要的依赖。以 Maven 为例,在 pom.xml 中添加以下依赖: 12345678910111213141516171819202122232425262728<!-- Flink Table API 依赖 --><dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-api-java-bridge</artifactId> <version>${flink.version}</version></depend...
Flink Phoenix
Created2026-03-14|Flink
pom1234567891011<dependency> <groupId>org.apache.phoenix</groupId> <artifactId>phoenix-spark</artifactId> <version>5.0.0-HBase-2.0</version> <exclusions> <exclusion> <groupId>org.glassfish</groupId> <artifactId>javax.el</artifactId> </exclusion> </exclusions></dependency>
Flink Redis
Created2026-03-14|Flink
pom12345<dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <version>3.3.0</version></dependency>
12…14
avatar
QuZheng
Articles
133
Tags
99
Categories
27
Follow Me
Announcement
This is my Blog
Recent Posts
Kafka基本使用2026-03-15
Flink Hello World2026-03-14
Flink Stream Connect2026-03-14
Flink Stream Union2026-03-14
Flink Introduction2026-03-14
Categories
  • Flink12
  • Flume1
  • HBase9
  • Hadoop21
  • Hive1
  • JavaEE13
  • Kettle11
  • LayUI1
Tags
Phoenix 相关Jar包 MongoDB使用 源码安装Nginx Flink Stream Connect HBase Source Code Linux网络管理 Partitioner Flink Table API Hadoop Java DataInput/DataOutput Linux文件管理 Linux基础知识 Spark环境部署 Python在线编程环境 源码安装Redis 免密登录 Flink Broadcast Windows Dev Env Linux进程管理 防火墙设置 Linux Quartz WordCount Linux基础命令 Tools 大数据项目 Linux系统配置 MapReduce VIM文本编辑器 JavaEE Jpyuter Notebook Kafka Redis Web Framework HDFS综合操作实验 GroupBy Python 乱码
Archives
  • March 2026 17
  • November 2023 2
  • October 2023 1
  • June 2023 7
  • May 2023 6
  • March 2023 6
  • February 2023 2
  • January 2023 36
Website Info
Article Count :
133
Unique Visitors :
Page Views :
Last Update :
© 2025 - 2026 By QuZhengFramework Hexo 8.1.1|Theme Butterfly 5.5.4