Flink+Kafka+Mysql(8.0)

我爱普洱茶 · 2025-2-24 01:38:33

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

一、前言阐明

Flink版本：1.14.6
Mysql版本：8.0
JDK版本：1.8
本实例主要实现功能如下：
模拟消息生成->Kafka->Flink->Mysql
其中Flink做数据流网络并定时批量写入到Mysql

本例使用Intellij IDEA作为项目开发的IDE。
整个项目结构如图所示：

二、项目代码已提交至 gitee

flink-kafka-mysql: Flink读取Kafka 消息并批量写入到 MySQL8.0
三、项目具体代码

POM文件内容：

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>org.example</groupId>
<artifactId>flink-kafka-mysql</artifactId>
<version>1.0-SNAPSHOT</version>
<properties>
<maven.compiler.source>8</maven.compiler.source>
<maven.compiler.target>8</maven.compiler.target>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
<flink.version>1.14.6</flink.version>
<scala.binary.version>2.11</scala.binary.version>
</properties>
<dependencies>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-java</artifactId>
<version>${flink.version}</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-clients_${scala.binary.version}</artifactId>
<version>${flink.version}</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-streaming-java_${scala.binary.version}</artifactId>
<version>${flink.version}</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-connector-kafka_${scala.binary.version}</artifactId>
<version>${flink.version}</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-connector-jdbc_${scala.binary.version}</artifactId>
<version>${flink.version}</version>
</dependency>
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-log4j12</artifactId>
<version>1.7.25</version>
</dependency>
<dependency>
<groupId>log4j</groupId>
<artifactId>log4j</artifactId>
<version>1.2.17</version>
</dependency>
<dependency>
<groupId>mysql</groupId>
<artifactId>mysql-connector-java</artifactId>
<version>8.0.23</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>druid</artifactId>
<version>1.2.8</version>
</dependency>
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka-clients</artifactId>
<version>2.1.1</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.70</version>
</dependency>
</dependencies>
<build>
<plugins>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-jar-plugin</artifactId>
<version>3.2.0</version>
<configuration>
<archive>
<manifest>
<addClasspath>true</addClasspath>
<classpathPrefix>lib/</classpathPrefix>
<mainClass>com.slink.StudentRunner</mainClass>
</manifest>
</archive>
</configuration>
</plugin>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-dependency-plugin</artifactId>
<version>3.1.2</version>
<executions>
<execution>
<id>copy-dependencies</id>
<phase>package</phase>
<goals>
<goal>copy-dependencies</goal>
</goals>
<configuration>
<outputDirectory>${project.build.directory}/lib</outputDirectory>
<includeScope>runtime</includeScope>
</configuration>
</execution>
</executions>
</plugin>
<plugin>
<groupId>org.apache.maven.plugins</groupId>
<artifactId>maven-assembly-plugin</artifactId>
<version>3.3.0</version>
<executions>
<execution>
<id>make-assembly</id>
<phase>package</phase>
<goals>
<goal>single</goal>
</goals>
<configuration>
<descriptors>
<descriptor>src/main/resources/assembly/assembly.xml</descriptor>
</descriptors>
</configuration>
</execution>
</executions>
</plugin>
</plugins>
</build>
</project>

复制代码

application-dev.properties配置文件：

# mysql-jdbc
jdbc.driver=com.mysql.cj.jdbc.Driver
jdbc.url=jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=UTF-8&useJDBCCompliantTimezoneShift=true&useLegacyDatetimeCode=false&serverTimezone=GMT%2B8&rewriteBatchedStatements=true
jdbc.username=root
jdbc.password=root
jdbc.druidInitialSize=10
jdbc.druidMaxActive=20
jdbc.druidMinIdle=5
jdbc.druidMaxWait=20000
jdbc.druidTimeBetweenEvictionRunsMillis=60000
jdbc.druidMaxEvictableIdleTimeMillis=3600000
jdbc.druidMinEvictableIdleTimeMillis=3240000
jdbc.druidTestWhileIdle=true
jdbc.druidTestOnBorrow=true
jdbc.druidTestOnReturn=false
jdbc.druidPoolPreparedStatements=true
jdbc.druidMaxPoolPreparedStatementPerConnectionSize=10
jdbc.druidFilters=stat,slf4j
jdbc.druidValidationQuery=select 1
# kafka
kafka.servers=127.0.0.1:9092
kafka.consumer.groupId=kafka.consumer.group
kafka.auto.offset.reset=latest
kafka.key.serializer=org.apache.kafka.common.serialization.StringSerializer
kafka.value.serializer=org.apache.kafka.common.serialization.StringSerializer
kafka.user.event.topic=testTopic

复制代码

Mysql数据表创建：

CREATE TABLE `student` (
`id` bigint(20) NOT NULL AUTO_INCREMENT,
`name1` varchar(50),
`name2` varchar(50),
`name3` varchar(50),
`name4` varchar(50),
`name5` varchar(50),
`name6` varchar(50),
`name7` varchar(50),
`name8` varchar(50),
`name9` varchar(50),
`name10` varchar(50),
`name11` varchar(50),
`name12` varchar(50),
`name13` varchar(50),
`name14` varchar(50),
`name15` varchar(50),
`name16` varchar(50),
`name17` varchar(50),
`name18` varchar(50),
`name19` varchar(50),
`name20` varchar(50),
`name21` varchar(50),
`name22` varchar(50),
`name23` varchar(50),
`name24` varchar(50),
`name25` varchar(50),
`name26` varchar(50),
`name27` varchar(50),
`name28` varchar(50),
`name29` varchar(50),
`name30` varchar(50),
`name31` varchar(50),
`name32` varchar(50),
`name33` varchar(50),
`name34` varchar(50),
`name35` varchar(50),
`name36` varchar(50),
`name37` varchar(50),
`name38` varchar(50),
`name39` varchar(50),
`name40` varchar(50),
`name41` varchar(50),
`name42` varchar(50),
`name43` varchar(50),
`name44` varchar(50),
`name45` varchar(50),
`name46` varchar(50),
`name47` varchar(50),
`name48` varchar(50),
`name49` varchar(50),
`name50` varchar(50),
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8 COLLATE=utf8_bin COMMENT='学生表';

复制代码

创建Student实体类：

package com.slink.entity;
import java.io.Serializable;
public class Student implements Serializable {
private long id;
private String name1;
private String name2;
private String name3;
private String name4;
private String name5;
private String name6;
private String name7;
private String name8;
private String name9;
private String name10;
private String name11;
private String name12;
private String name13;
private String name14;
private String name15;
private String name16;
private String name17;
private String name18;
private String name19;
private String name20;
private String name21;
private String name22;
private String name23;
private String name24;
private String name25;
private String name26;
private String name27;
private String name28;
private String name29;
private String name30;
private String name31;
private String name32;
private String name33;
private String name34;
private String name35;
private String name36;
private String name37;
private String name38;
private String name39;
private String name40;
private String name41;
private String name42;
private String name43;
private String name44;
private String name45;
private String name46;
private String name47;
private String name48;
private String name49;
private String name50;
public long getId() {
return id;
}
public void setId(long id) {
this.id = id;
}
public String getName1() {
return name1;
}
public void setName1(String name1) {
this.name1 = name1;
}
public String getName2() {
return name2;
}
public void setName2(String name2) {
this.name2 = name2;
}
public String getName3() {
return name3;
}
public void setName3(String name3) {
this.name3 = name3;
}
public String getName4() {
return name4;
}
public void setName4(String name4) {
this.name4 = name4;
}
public String getName5() {
return name5;
}
public void setName5(String name5) {
this.name5 = name5;
}
public String getName6() {
return name6;
}
public void setName6(String name6) {
this.name6 = name6;
}
public String getName7() {
return name7;
}
public void setName7(String name7) {
this.name7 = name7;
}
public String getName8() {
return name8;
}
public void setName8(String name8) {
this.name8 = name8;
}
public String getName9() {
return name9;
}
public void setName9(String name9) {
this.name9 = name9;
}
public String getName10() {
return name10;
}
public void setName10(String name10) {
this.name10 = name10;
}
public String getName11() {
return name11;
}
public void setName11(String name11) {
this.name11 = name11;
}
public String getName12() {
return name12;
}
public void setName12(String name12) {
this.name12 = name12;
}
public String getName13() {
return name13;
}
public void setName13(String name13) {
this.name13 = name13;
}
public String getName14() {
return name14;
}
public void setName14(String name14) {
this.name14 = name14;
}
public String getName15() {
return name15;
}
public void setName15(String name15) {
this.name15 = name15;
}
public String getName16() {
return name16;
}
public void setName16(String name16) {
this.name16 = name16;
}
public String getName17() {
return name17;
}
public void setName17(String name17) {
this.name17 = name17;
}
public String getName18() {
return name18;
}
public void setName18(String name18) {
this.name18 = name18;
}
public String getName19() {
return name19;
}
public void setName19(String name19) {
this.name19 = name19;
}
public String getName20() {
return name20;
}
public void setName20(String name20) {
this.name20 = name20;
}
public String getName21() {
return name21;
}
public void setName21(String name21) {
this.name21 = name21;
}
public String getName22() {
return name22;
}
public void setName22(String name22) {
this.name22 = name22;
}
public String getName23() {
return name23;
}
public void setName23(String name23) {
this.name23 = name23;
}
public String getName24() {
return name24;
}
public void setName24(String name24) {
this.name24 = name24;
}
public String getName25() {
return name25;
}
public void setName25(String name25) {
this.name25 = name25;
}
public String getName26() {
return name26;
}
public void setName26(String name26) {
this.name26 = name26;
}
public String getName27() {
return name27;
}
public void setName27(String name27) {
this.name27 = name27;
}
public String getName28() {
return name28;
}
public void setName28(String name28) {
this.name28 = name28;
}
public String getName29() {
return name29;
}
public void setName29(String name29) {
this.name29 = name29;
}
public String getName30() {
return name30;
}
public void setName30(String name30) {
this.name30 = name30;
}
public String getName31() {
return name31;
}
public void setName31(String name31) {
this.name31 = name31;
}
public String getName32() {
return name32;
}
public void setName32(String name32) {
this.name32 = name32;
}
public String getName33() {
return name33;
}
public void setName33(String name33) {
this.name33 = name33;
}
public String getName34() {
return name34;
}
public void setName34(String name34) {
this.name34 = name34;
}
public String getName35() {
return name35;
}
public void setName35(String name35) {
this.name35 = name35;
}
public String getName36() {
return name36;
}
public void setName36(String name36) {
this.name36 = name36;
}
public String getName37() {
return name37;
}
public void setName37(String name37) {
this.name37 = name37;
}
public String getName38() {
return name38;
}
public void setName38(String name38) {
this.name38 = name38;
}
public String getName39() {
return name39;
}
public void setName39(String name39) {
this.name39 = name39;
}
public String getName40() {
return name40;
}
public void setName40(String name40) {
this.name40 = name40;
}
public String getName41() {
return name41;
}
public void setName41(String name41) {
this.name41 = name41;
}
public String getName42() {
return name42;
}
public void setName42(String name42) {
this.name42 = name42;
}
public String getName43() {
return name43;
}
public void setName43(String name43) {
this.name43 = name43;
}
public String getName44() {
return name44;
}
public void setName44(String name44) {
this.name44 = name44;
}
public String getName45() {
return name45;
}
public void setName45(String name45) {
this.name45 = name45;
}
public String getName46() {
return name46;
}
public void setName46(String name46) {
this.name46 = name46;
}
public String getName47() {
return name47;
}
public void setName47(String name47) {
this.name47 = name47;
}
public String getName48() {
return name48;
}
public void setName48(String name48) {
this.name48 = name48;
}
public String getName49() {
return name49;
}
public void setName49(String name49) {
this.name49 = name49;
}
public String getName50() {
return name50;
}
public void setName50(String name50) {
this.name50 = name50;
}
}

复制代码

创建吸取Kafka消息的实体SinkLog：

package com.slink.entity;
import com.alibaba.fastjson.JSON;
import com.slink.util.EmptyNullUtil;
import org.apache.commons.lang3.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.io.Serializable;
public class SinkLog implements Serializable {
private static final Logger log = LoggerFactory.getLogger(SinkLog.class);
/**
* 请求时间(2024-10-28T17:06:51+08:00)
*/
private String timestamp;
/**
* 客户端地址
*/
private String remoteAddr;
/**
* HTTP请求状态
*/
private int status;
/**
* 请求的URI和HTTP协议(POST /sink/ HTTP/1.1)
*/
private String request;
/**
* 后台upstream的地址，即真正提供服务的主机地址(127.0.0.1:80)
*/
private String upstrAddr;
/**
* 发送给客户端文件内容大小
*/
private long bytes;
/**
* 请求参数主体
*/
private Student requestBody;
/**
* 用户终端浏览器等信息(Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; SV1; GTB7.0; .NET4.0C)
*/
private String agent;
public String getTimestamp() {
return timestamp;
}
public void setTimestamp(String timestamp) {
this.timestamp = timestamp;
}
public String getRemoteAddr() {
return remoteAddr;
}
public void setRemoteAddr(String remoteAddr) {
this.remoteAddr = remoteAddr;
}
public int getStatus() {
return status;
}
public void setStatus(int status) {
this.status = status;
}
public String getRequest() {
return request;
}
public void setRequest(String request) {
this.request = request;
}
public String getUpstrAddr() {
return upstrAddr;
}
public void setUpstrAddr(String upstrAddr) {
this.upstrAddr = upstrAddr;
}
public long getBytes() {
return bytes;
}
public void setBytes(long bytes) {
this.bytes = bytes;
}
public Student getRequestBody() {
return requestBody;
}
public void setRequestBody(Student requestBody) {
this.requestBody = requestBody;
}
public String getAgent() {
return agent;
}
public void setAgent(String agent) {
this.agent = agent;
}
/**
* 解析字符串成Student对象
*/
public static Student build(String val) {
if (StringUtils.isEmpty(val) || !val.contains("/sink")) {
return null;
}
log.info("消息:{}", val);
try {
val = val.replace("\", StringUtils.EMPTY);
Student student = JSON.parseObject(val, SinkLog.class).getRequestBody();
EmptyNullUtil.stringNullToEmpty(student);
return student;
} catch (Exception e) {
log.error("解析字符串成Student对象异常:", e);
return null;
}
}
}

复制代码

创建读取配置文件实体（SinkProperties）以及方法：

package com.slink.properties;
import org.apache.commons.lang3.StringUtils;
import java.io.IOException;
import java.io.InputStream;
import java.io.Serializable;
import java.util.Properties;
public class SinkProperties implements Serializable {
private String jdbcDriver;
private String jdbcUrl;
private String jdbcUsername;
private String jdbcPassword;
private int jdbcDruidInitialSize;
private int jdbcDruidMaxActive;
private int jdbcDruidMinIdle;
private int jdbcDruidMaxWait;
private long jdbcDruidTimeBetweenEvictionRunsMillis;
private long jdbcDruidMaxEvictableIdleTimeMillis;
private long jdbcDruidMinEvictableIdleTimeMillis;
private boolean jdbcDruidTestWhileIdle;
private boolean jdbcDruidTestOnBorrow;
private boolean jdbcDruidTestOnReturn;
private boolean jdbcDruidPoolPreparedStatements;
private int jdbcDruidMaxPoolPreparedStatementPerConnectionSize;
private String jdbcDruidFilters;
private String jdbcDruidValidationQuery;
private String kafkaServer;
private String kafkaConsumerGroupId;
private String kafkaKeySerializer;
private String kafkaValueSerializer;
private String kafkaUserEventTopic;
private String kafkaAutoOffsetReset;
public String getJdbcDriver() {
return jdbcDriver;
}
public void setJdbcDriver(String jdbcDriver) {
this.jdbcDriver = jdbcDriver;
}
public String getJdbcUrl() {
return jdbcUrl;
}
public void setJdbcUrl(String jdbcUrl) {
this.jdbcUrl = jdbcUrl;
}
public String getJdbcUsername() {
return jdbcUsername;
}
public void setJdbcUsername(String jdbcUsername) {
this.jdbcUsername = jdbcUsername;
}
public String getJdbcPassword() {
return jdbcPassword;
}
public void setJdbcPassword(String jdbcPassword) {
this.jdbcPassword = jdbcPassword;
}
public int getJdbcDruidInitialSize() {
return jdbcDruidInitialSize;
}
public void setJdbcDruidInitialSize(int jdbcDruidInitialSize) {
this.jdbcDruidInitialSize = jdbcDruidInitialSize;
}
public int getJdbcDruidMaxActive() {
return jdbcDruidMaxActive;
}
public void setJdbcDruidMaxActive(int jdbcDruidMaxActive) {
this.jdbcDruidMaxActive = jdbcDruidMaxActive;
}
public int getJdbcDruidMinIdle() {
return jdbcDruidMinIdle;
}
public void setJdbcDruidMinIdle(int jdbcDruidMinIdle) {
this.jdbcDruidMinIdle = jdbcDruidMinIdle;
}
public int getJdbcDruidMaxWait() {
return jdbcDruidMaxWait;
}
public void setJdbcDruidMaxWait(int jdbcDruidMaxWait) {
this.jdbcDruidMaxWait = jdbcDruidMaxWait;
}
public long getJdbcDruidTimeBetweenEvictionRunsMillis() {
return jdbcDruidTimeBetweenEvictionRunsMillis;
}
public void setJdbcDruidTimeBetweenEvictionRunsMillis(long jdbcDruidTimeBetweenEvictionRunsMillis) {
this.jdbcDruidTimeBetweenEvictionRunsMillis = jdbcDruidTimeBetweenEvictionRunsMillis;
}
public long getJdbcDruidMaxEvictableIdleTimeMillis() {
return jdbcDruidMaxEvictableIdleTimeMillis;
}
public void setJdbcDruidMaxEvictableIdleTimeMillis(long jdbcDruidMaxEvictableIdleTimeMillis) {
this.jdbcDruidMaxEvictableIdleTimeMillis = jdbcDruidMaxEvictableIdleTimeMillis;
}
public long getJdbcDruidMinEvictableIdleTimeMillis() {
return jdbcDruidMinEvictableIdleTimeMillis;
}
public void setJdbcDruidMinEvictableIdleTimeMillis(long jdbcDruidMinEvictableIdleTimeMillis) {
this.jdbcDruidMinEvictableIdleTimeMillis = jdbcDruidMinEvictableIdleTimeMillis;
}
public boolean isJdbcDruidTestWhileIdle() {
return jdbcDruidTestWhileIdle;
}
public void setJdbcDruidTestWhileIdle(boolean jdbcDruidTestWhileIdle) {
this.jdbcDruidTestWhileIdle = jdbcDruidTestWhileIdle;
}
public boolean isJdbcDruidTestOnBorrow() {
return jdbcDruidTestOnBorrow;
}
public void setJdbcDruidTestOnBorrow(boolean jdbcDruidTestOnBorrow) {
this.jdbcDruidTestOnBorrow = jdbcDruidTestOnBorrow;
}
public boolean isJdbcDruidTestOnReturn() {
return jdbcDruidTestOnReturn;
}
public void setJdbcDruidTestOnReturn(boolean jdbcDruidTestOnReturn) {
this.jdbcDruidTestOnReturn = jdbcDruidTestOnReturn;
}
public boolean isJdbcDruidPoolPreparedStatements() {
return jdbcDruidPoolPreparedStatements;
}
public void setJdbcDruidPoolPreparedStatements(boolean jdbcDruidPoolPreparedStatements) {
this.jdbcDruidPoolPreparedStatements = jdbcDruidPoolPreparedStatements;
}
public int getJdbcDruidMaxPoolPreparedStatementPerConnectionSize() {
return jdbcDruidMaxPoolPreparedStatementPerConnectionSize;
}
public void setJdbcDruidMaxPoolPreparedStatementPerConnectionSize(int jdbcDruidMaxPoolPreparedStatementPerConnectionSize) {
this.jdbcDruidMaxPoolPreparedStatementPerConnectionSize = jdbcDruidMaxPoolPreparedStatementPerConnectionSize;
}
public String getJdbcDruidFilters() {
return jdbcDruidFilters;
}
public void setJdbcDruidFilters(String jdbcDruidFilters) {
this.jdbcDruidFilters = jdbcDruidFilters;
}
public String getJdbcDruidValidationQuery() {
return jdbcDruidValidationQuery;
}
public void setJdbcDruidValidationQuery(String jdbcDruidValidationQuery) {
this.jdbcDruidValidationQuery = jdbcDruidValidationQuery;
}
public String getKafkaServer() {
return kafkaServer;
}
public void setKafkaServer(String kafkaServer) {
this.kafkaServer = kafkaServer;
}
public String getKafkaConsumerGroupId() {
return kafkaConsumerGroupId;
}
public void setKafkaConsumerGroupId(String kafkaConsumerGroupId) {
this.kafkaConsumerGroupId = kafkaConsumerGroupId;
}
public String getKafkaKeySerializer() {
return kafkaKeySerializer;
}
public void setKafkaKeySerializer(String kafkaKeySerializer) {
this.kafkaKeySerializer = kafkaKeySerializer;
}
public String getKafkaValueSerializer() {
return kafkaValueSerializer;
}
public void setKafkaValueSerializer(String kafkaValueSerializer) {
this.kafkaValueSerializer = kafkaValueSerializer;
}
public String getKafkaUserEventTopic() {
return kafkaUserEventTopic;
}
public void setKafkaUserEventTopic(String kafkaUserEventTopic) {
this.kafkaUserEventTopic = kafkaUserEventTopic;
}
public String getKafkaAutoOffsetReset() {
return kafkaAutoOffsetReset;
}
public void setKafkaAutoOffsetReset(String kafkaAutoOffsetReset) {
this.kafkaAutoOffsetReset = kafkaAutoOffsetReset;
}
public void create() throws IOException {
String active = System.getenv("active");
active = StringUtils.isEmpty(active) ? "dev" : active;
String resource = "application-".concat(active).concat(".properties");
InputStream inputStream = this.getClass().getClassLoader().getResourceAsStream(resource);
Properties properties = new Properties();
properties.load(inputStream);
properties.list(System.out);
this.jdbcDriver = properties.getProperty("jdbc.driver");
this.jdbcUrl = properties.getProperty("jdbc.url");
this.jdbcUsername = properties.getProperty("jdbc.username");
this.jdbcPassword = properties.getProperty("jdbc.password");
this.jdbcDruidInitialSize = Integer.parseInt(properties.getProperty("jdbc.druidInitialSize"));
this.jdbcDruidMaxActive = Integer.parseInt(properties.getProperty("jdbc.druidMaxActive"));
this.jdbcDruidMinIdle = Integer.parseInt(properties.getProperty("jdbc.druidMinIdle"));
this.jdbcDruidMaxWait = Integer.parseInt(properties.getProperty("jdbc.druidMaxWait"));
this.jdbcDruidTimeBetweenEvictionRunsMillis = Long.parseLong(properties.getProperty("jdbc.druidTimeBetweenEvictionRunsMillis"));
this.jdbcDruidMaxEvictableIdleTimeMillis = Long.parseLong(properties.getProperty("jdbc.druidMaxEvictableIdleTimeMillis"));
this.jdbcDruidMinEvictableIdleTimeMillis = Long.parseLong(properties.getProperty("jdbc.druidMinEvictableIdleTimeMillis"));
this.jdbcDruidTestWhileIdle = Boolean.valueOf(properties.getProperty("jdbc.druidTestWhileIdle"));
this.jdbcDruidTestOnBorrow = Boolean.valueOf(properties.getProperty("jdbc.druidTestOnBorrow"));
this.jdbcDruidTestOnReturn = Boolean.valueOf(properties.getProperty("jdbc.druidTestOnReturn"));
this.jdbcDruidPoolPreparedStatements = Boolean.valueOf(properties.getProperty("jdbc.druidPoolPreparedStatements"));
this.jdbcDruidMaxPoolPreparedStatementPerConnectionSize = Integer.parseInt(properties.getProperty("jdbc.druidMaxPoolPreparedStatementPerConnectionSize"));
this.jdbcDruidFilters = properties.getProperty("jdbc.druidFilters");
this.jdbcDruidValidationQuery = properties.getProperty("jdbc.druidValidationQuery");
this.kafkaServer = properties.getProperty("kafka.servers");
this.kafkaConsumerGroupId = properties.getProperty("kafka.consumer.groupId");
this.kafkaKeySerializer = properties.getProperty("kafka.key.serializer");
this.kafkaValueSerializer = properties.getProperty("kafka.value.serializer");
this.kafkaUserEventTopic = properties.getProperty("kafka.user.event.topic");
this.kafkaAutoOffsetReset = properties.getProperty("kafka.auto.offset.reset");
}
}

复制代码

主体函数
主要实现读取kafka消息，使用map和json把消息转换为Student对象数据流
创建10秒的滚动窗口聚合Student数据，末了调用自定义sink存入至于mysql

package com.slink;
import com.slink.entity.Student;
import com.slink.function.StudentProcessWindowFunction;
import com.slink.properties.SinkProperties;
import com.slink.util.Constant;
import com.slink.util.KafkaSourceUtil;
import com.slink.util.SinkFunctionUtil;
import com.slink.util.StreamExecutionEnvironmentUtil;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.sink.SinkFunction;
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
public class StudentRunner {
public static void main(String[] args) throws Exception {
// 创建流处理执行环境
final StreamExecutionEnvironment env = StreamExecutionEnvironmentUtil.buildStreamExecutionEnvironment();
// 读取环境变量 jdbc、kafka
SinkProperties properties = new SinkProperties();
properties.create();
// 构建kafka源
DataStream<Student> kafkaOut = KafkaSourceUtil.buildDataStream(properties, env, Constant.TWO);
// 构建SinkFunction
SinkFunction<Student> sinkFunction = SinkFunctionUtil.buildSinkFunction(properties);
/**
* 将清洗后的数据通过窗口去聚合(每10秒滚动窗口聚合一次)写入Mysql
* 在数据清洗完成后，将数据写入Mysql数据库。这里我们设置了写入Mysql的并行度为2(setParallelism(2))。
* 这意味着将有2个并发任务负责将数据写入到Mysql。由于Mysql的写入通常涉及磁盘I/O操作，设置较低的并行度可以避免I/O争用
*/
// 全局10秒滚动窗口
kafkaOut.rebalance().windowAll(TumblingProcessingTimeWindows.of(Time.seconds(10)))
.process(new StudentProcessWindowFunction())
.disableChaining()
.addSink(sinkFunction)
.name("KafkaFoMysql");
// .setParallelism(2);
kafkaOut.print(); //调度输出
env.execute("flink kafka to Mysql");
}
}

复制代码

StreamExecutionEnvironmentUtil：

package com.slink.util;
import org.apache.flink.streaming.api.CheckpointingMode;
import org.apache.flink.streaming.api.environment.CheckpointConfig;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
public class StreamExecutionEnvironmentUtil {
private static final String statebackend_address = "file:/Users/xumingzhong/Desktop/xmz";
public static StreamExecutionEnvironment buildStreamExecutionEnvironment(){
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
/**
* 设置全局并行度（默认并行度）所有算子，默认的并行度就都为6。一般不会在程序中设置全局并行度。
* 因为如果在程序中对全局并行度进行硬编码，会导致无法动态扩容。
* 注意：由于keyBy不是算子，所以无法对keyBy设置并行度
*/
// env.setParallelism(1);
//每隔10s进行启动一个检查点【设置checkpoint的周期】
env.enableCheckpointing(10000);
//设置EXACTLY_ONCE语义,默认就是这个
env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);
//确保检查点之间有1s的时间间隔【checkpoint最小间隔】
env.getCheckpointConfig().setMinPauseBetweenCheckpoints(1000);
//检查点必须在60s之内完成，或者被丢弃【checkpoint超时时间】
env.getCheckpointConfig().setCheckpointTimeout(60000);
//同一时间只允许进行一次检查点
env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);
//表示一旦Flink程序被cancel后，会保留checkpoint数据，以便根据实际需要恢复到指定的checkpoint
env.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);
//设置statebackend,将检查点保存在hdfs上面，默认保存在内存中。这里先保存到本地
// env.setStateBackend(new FsStateBackend(statebackend_address));
return env;
}
}

复制代码

SinkFunctionUtil：

package com.slink.util;
import com.slink.entity.Student;
import com.slink.properties.SinkProperties;
import org.apache.flink.connector.jdbc.JdbcConnectionOptions;
import org.apache.flink.connector.jdbc.JdbcExecutionOptions;
import org.apache.flink.connector.jdbc.JdbcSink;
import org.apache.flink.streaming.api.functions.sink.SinkFunction;
import java.sql.PreparedStatement;
public class SinkFunctionUtil {
/**
* 插入Student表SQL语句
*/
private static final String STUDENT_INSERT = "insert into student(name1, name2, name3, name4, name5, name6, name7, name8, name9, name10, name11, name12, name13, name14, name15, name16, name17, name18, name19, name20, name21, name22, name23, name24, name25, name26, name27, name28, name29, name30, name31, name32, name33, name34, name35, name36, name37, name38, name39, name40, name41, name42, name43, name44, name45, name46, name47, name48, name49, name50) values(?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)";
/**
* 构建SinkFunction
*/
public static SinkFunction<Student> buildSinkFunction(SinkProperties properties){
return JdbcSink.sink(STUDENT_INSERT, // SQL 插入语句
(PreparedStatement ps, Student student) -> {
ps.setString(1, student.getName1());
ps.setString(2, student.getName2());
ps.setString(3, student.getName3());
ps.setString(4, student.getName4());
ps.setString(5, student.getName5());
ps.setString(6, student.getName6());
ps.setString(7, student.getName7());
ps.setString(8, student.getName8());
ps.setString(9, student.getName9());
ps.setString(10, student.getName10());
ps.setString(11, student.getName11());
ps.setString(12, student.getName12());
ps.setString(13, student.getName13());
ps.setString(14, student.getName14());
ps.setString(15, student.getName15());
ps.setString(16, student.getName16());
ps.setString(17, student.getName17());
ps.setString(18, student.getName18());
ps.setString(19, student.getName19());
ps.setString(20, student.getName20());
ps.setString(21, student.getName21());
ps.setString(22, student.getName22());
ps.setString(23, student.getName23());
ps.setString(24, student.getName24());
ps.setString(25, student.getName25());
ps.setString(26, student.getName26());
ps.setString(27, student.getName27());
ps.setString(28, student.getName28());
ps.setString(29, student.getName29());
ps.setString(30, student.getName30());
ps.setString(31, student.getName31());
ps.setString(32, student.getName32());
ps.setString(33, student.getName33());
ps.setString(34, student.getName34());
ps.setString(35, student.getName35());
ps.setString(36, student.getName36());
ps.setString(37, student.getName37());
ps.setString(38, student.getName38());
ps.setString(39, student.getName39());
ps.setString(40, student.getName40());
ps.setString(41, student.getName41());
ps.setString(42, student.getName42());
ps.setString(43, student.getName43());
ps.setString(44, student.getName44());
ps.setString(45, student.getName45());
ps.setString(46, student.getName46());
ps.setString(47, student.getName47());
ps.setString(48, student.getName48());
ps.setString(49, student.getName49());
ps.setString(50, student.getName50());
},
getJdbcExecutionOptions(properties),
getJdbcConnectionOptions(properties)
);
}
/**
* 设置jdbc批处理
*/
private static JdbcExecutionOptions getJdbcExecutionOptions(SinkProperties properties) {
return JdbcExecutionOptions.builder()
.withBatchSize(5000) // 设置批量插入大小
.withBatchIntervalMs(200) // 设置批量插入的时间间隔-毫秒
.withMaxRetries(3) // 设置最大重试次数
.build();
}
/**
* 设置jdbc连接
*/
public static JdbcConnectionOptions getJdbcConnectionOptions(SinkProperties properties){
return new JdbcConnectionOptions.JdbcConnectionOptionsBuilder()
.withUrl(properties.getJdbcUrl())
.withDriverName(properties.getJdbcDriver())
.withUsername(properties.getJdbcUsername())
.withPassword(properties.getJdbcPassword())
//.withDataSource(dataSource) 1.17.X版本支持数据池连接配置，需JDK11
.build();
}
}

复制代码

KafkaSourceUtil：

package com.slink.util;
import com.slink.entity.SinkLog;
import com.slink.entity.Student;
import com.slink.properties.SinkProperties;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import java.util.Properties;
public class KafkaSourceUtil {
/**
* 设置Kafka源
* Kafka 消费并行度：通过 setParallelism(x) 为从 Kafka 读取数据的操作设置了并行度为x。
* 也就是说，Flink 将会启动 x 个并行任务来从Kafka 的 kafkaTopic 主题中消费数据。
* 这个并行度可以根据 Kafka 分区的数量调整。如果 Kafka 有 x 个分区，那么设置并行度为 x 是合理的，
* 这样可以保证每个分区都有一个并发实例进行处理
*/
public static DataStream<Student> buildDataStream(SinkProperties properties, StreamExecutionEnvironment env, int parallelism) {
// 构建kafka环境变量对象
Properties props = new Properties();
props.put("bootstrap.servers", properties.getKafkaServer());
props.put("group.id", properties.getKafkaConsumerGroupId());
props.put("auto.offset.reset", properties.getKafkaAutoOffsetReset());
return env.addSource(new FlinkKafkaConsumer<>(
properties.getKafkaUserEventTopic(),
new SimpleStringSchema(),
props)).setParallelism(parallelism)
.map(new MapFunction<String, Student>() {
@Override
public Student map(String val) {
// 解析字符串转换Student对象
return SinkLog.build(val);
}
}).filter(v -> v != null);
}
}

复制代码

工具类：EmptyNullUtil

package com.slink.util;
import org.apache.commons.lang3.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.lang.reflect.Field;
import java.lang.reflect.Method;
public class EmptyNullUtil {
private static final Logger log = LoggerFactory.getLogger(EmptyNullUtil.class);
/**
* 将属性类型为String，值为null的设置为 ""
*/
public static <T> void stringNullToEmpty(T t) {
if (null == t) {
return;
}
Field[] declaredFields = t.getClass().getDeclaredFields();
for (Field field : declaredFields) {
field.setAccessible(true);
if (field.getType().equals(String.class)) {
// 将属性的首字母大写
String methodName = field.getName().replaceFirst(field.getName().substring(0, 1), field.getName().substring(0, 1).toUpperCase());
try {
Method methodGet = t.getClass().getMethod("get" + methodName);
// 调用getter方法获取属性值
String str = (String) methodGet.invoke(t);
if (StringUtils.isBlank(str)) {
// 如果为null的String类型的属性则重新复制为空字符串
field.set(t, field.getType().getConstructor(field.getType()).newInstance(StringUtils.EMPTY));
}
} catch (Exception e) {
log.warn("[EmptyNullUtil.stringBlankToNull] e:{}", e);
}
}
}
}
}

复制代码

窗口函数自定义处理类：StudentProcessWindowFunction

package com.slink.function;
import com.slink.StudentRunner;
import com.slink.entity.Student;
import org.apache.commons.compress.utils.Lists;
import org.apache.flink.streaming.api.functions.windowing.ProcessAllWindowFunction;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.util.Collector;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.util.List;
import java.util.stream.Collectors;
import java.util.stream.StreamSupport;
public class StudentProcessWindowFunction extends ProcessAllWindowFunction<Student, Student, TimeWindow> {
private static final Logger log = LoggerFactory.getLogger(StudentRunner.class);
@Override
public void process(ProcessAllWindowFunction<Student, Student, TimeWindow>.Context context, Iterable<Student> iterable, Collector<Student> out) {
log.info("窗口聚合数据条数:{}", StreamSupport.stream(iterable.spliterator(), Boolean.FALSE).collect(Collectors.toList()).size());
// 直接将窗口内的每个 Student 输出
for (Student order : iterable) {
out.collect(order);
}
}
}

复制代码

四、运行测试

模拟数据每秒推送一条数据至Kafka:

package com.slink;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.ProducerConfig;
import org.apache.kafka.clients.producer.ProducerRecord;
import org.apache.kafka.common.serialization.StringSerializer;
import java.util.Properties;
public class Test2 {
public static void main(String[] args) {
String value = "{ "timestamp": "2024-11-05T17:38:56+08:00", "remoteAddr": "61.132.71.10","costime": "0.000","realtime": "0.000","status": 405,"xForwarded": "","referer": "","request": "POST /sink HTTP/1.1","upstrAddr": "127.0.0.1:80","bytes":157,"requestBody":{"name39":"拓扑丝路39号","name38":"拓扑丝路38号","name37":"拓扑丝路37号","name36":"拓扑丝路36号","name35":"拓扑丝路35号","name34":"拓扑丝路34号","name33":"拓扑丝路33号","name32":"拓扑丝路32号","name31":"拓扑丝路31号","name30":"拓扑丝路30号","name29":"拓扑丝路29号","name28":"拓扑丝路28号","name27":"拓扑丝路27号","name6":"拓扑丝路6号","name26":"拓扑丝路26号","name5":"拓扑丝路5号","name25":"拓扑丝路25号","name4":"拓扑丝路4号","name24":"拓扑丝路24号","name3":"拓扑丝路3号","name23":"拓扑丝路23号","name22":"拓扑丝路22号","name9":"拓扑丝路9号","name21":"拓扑丝路21号","name8":"拓扑丝路8号","name20":"拓扑丝路20号","name7":"拓扑丝路7号","name2":"拓扑丝路2号","name1":"拓扑丝路1号","name19":"拓扑丝路19号","name18":"拓扑丝路18号","name17":"拓扑丝路17号","name16":"拓扑丝路16号","name15":"拓扑丝路15号","name14":"拓扑丝路14号","name13":"拓扑丝路13号","name12":"拓扑丝路12号","name11":"拓扑丝路11号","name10":"拓扑丝路10号","name50":"拓扑丝路50号","name49":"拓扑丝路49号","name48":"拓扑丝路48号","name47":"拓扑丝路47号","name46":"拓扑丝路46号","name45":"拓扑丝路45号","name44":"拓扑丝路44号","name43":"拓扑丝路43号","name42":"拓扑丝路42号","name41":"拓扑丝路41号","name40":"拓扑丝路40号"},"agent": "PostmanRuntime/7.42.0" }";
//创建生产者
Properties properties = new Properties();
properties.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG,"127.0.0.1:9092");
properties.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
properties.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG,StringSerializer.class.getName());
//优化参数
properties.put(ProducerConfig.BATCH_SIZE_CONFIG,1024*1024);//生产者尝试缓存记录，为每一个分区缓存一个mb的数据
properties.put(ProducerConfig.LINGER_MS_CONFIG,500);//最多等待0.5秒.
KafkaProducer<String, String> kafkaProducer = new KafkaProducer<String, String>(properties);
for(int i=0; i<10000; i++){
ProducerRecord<String, String> record = new ProducerRecord<>("testTopic", "key001", value);
kafkaProducer.send(record);
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
}
kafkaProducer.flush();
kafkaProducer.close();
}
}

复制代码

运行主体函数：StudentRunner

查询Mysql日记

实例运行乐成
五、总结

本文实例了实现了从Kafka及时读取数据，根据定制化处理数据，通过flink窗口模式批量写入数据库mysql，可根据自身需求写入其他存储(ES、Redis等)。该实例适合在对数据库及时性要求不高，大概是准及时数据分析时的场景。如若数据量大的环境下，聚合十秒钟数据达万条，那么这样批量写会比单条性能进步很多倍。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

Flink+Kafka+Mysql(8.0)

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块