大数据之Flink本地环境搭建&构建第一个Flink应用


一般来说,线上都是集群模式,那么单机模式方便我们测试和学习。

环境要求

本地机器上需要有 Java 8 和 maven 环境,推荐在linux或者mac上开发Flink应用:

如果有 Java 8 环境,运行下面的命令会输出如下版本信息:

510a825bb50a810b2f950590f894c5a9-本地环境搭建&构建第一个Flink应用.resources/34F234C6-C9D6-46AB-A864-652BE177B4CA.png)

如果有 maven 环境,运行下面的命令会输出如下版本信息:

d466ed9d3338048745899c7db8150c5a-本地环境搭建&构建第一个Flink应用.resources/1A1D2049-1042-43E1-BE0B-6D9FAA8224BE.png)

开发工具推荐使用 ItelliJ IDEA。

第一种方式

来这里https://flink.apache.org/

看这里:
50d9244cad5d21c4fffca5c1af808977-本地环境搭建&构建第一个Flink应用.resources/E0A8FC57-9184-4BE8-8D20-BDD91C3C44FD.png)

注意:

1
An Apache Hadoop installation is not required to use Apache Flink. For users that use Flink without any Hadoop components, we recommend the release without bundled Hadoop libraries.

这是啥意思?
这个意思就是说Flink可以不依赖Hadoop环境,如果说单机玩的话,下载一个only版本就行了。

第二种方式(不推荐)

1
2
3
git clone https://github.com/apache/flink.git 
cd flink
mvn clean package -DskipTests

然后进入编译好的Flink中去执行 bin/start-cluster.sh

其他乱七八糟的安装办法

比如 Mac用户可以用brew install apache-flink ,前提是安装过 brew这个mac下的工具.

我们先到Flink的目录下来:
如下:

1
2
$ flink-1.7.1 pwd
/Users/wangzhiwu/Downloads/flink-1.7.1

19d1b2fb4d6b1fb3bff67522a239f2ca-本地环境搭建&构建第一个Flink应用.resources/BE68C066-BD15-4FAF-B649-82D9B26F255D.png)

执行命令:

a596b49f69bd4fcd8058bfc7800d5cc0-本地环境搭建&构建第一个Flink应用.resources/C88AEAF7-42B7-4AD1-A793-3E89EBE751E2.png)

接着就可以进入 web 页面(http://localhost:8081/) 查看

cd63db57b32a8862c5e0d2e8152f83ec-本地环境搭建&构建第一个Flink应用.resources/DAEECBBB-0FB7-4D4E-B338-B3181C23B6CB.png)

恭喜你,一个单机版的flink就跑起来了。

构建一个应用

当然了,我们可以用maven,一顿new,new出来一个过程,这里我们将使用 Flink Maven Archetype 来创建我们的项目结构和一些初始的默认依赖。在你的工作目录下,运行如下命令来创建项目:

1
2
3
4
5
6
7
8
9
mvn archetype:generate \
-DarchetypeGroupId=org.apache.flink \
-DarchetypeArtifactId=flink-quickstart-java \
-DarchetypeVersion=1.7.2 \
-DgroupId=flink-project \
-DartifactId=flink-project \
-Dversion=0.1 \
-Dpackage=myflink \
-DinteractiveMode=false

这样一个工程就构建好了。

还有一个更加牛逼的办法,看这里:

1
curl https://flink.apache.org/q/quickstart.sh | bash

直接在命令行执行上面的命令,结果如下图:

92b875adb611a4ce657c7535c19fd8b1-本地环境搭建&构建第一个Flink应用.resources/A78DC26C-BD00-44A9-9481-FE67B9BAE9CF.png)

同样可以构建一个Flink工程,而且自带一些demo。

原理是什么?点一下它看看就明白了。
https://flink.apache.org/q/quickstart.sh

编写一个入门级的WordCount

class WordCount {
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55

//
// Program
//

public static void main(String[] args) throws Exception {

// set up the execution environment
final ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment();

// get input data
DataSet<String> text = env.fromElements(
"To be, or not to be,--that is the question:--",
"Whether 'tis nobler in the mind to suffer",
"The slings and arrows of outrageous fortune",
"Or to take arms against a sea of troubles,"
);

DataSet<Tuple2<String, Integer>> counts =
// split up the lines in pairs (2-tuples) containing: (word,1)
text.flatMap(new LineSplitter())
// group by the tuple field "0" and sum up tuple field "1"
.groupBy(0) //(i,1) (am,1) (chinese,1)
.sum(1);

// execute and print result
counts.print();

}

//
// User Functions
//

/**
* Implements the string tokenizer that splits sentences into words as a user-defined
* FlatMapFunction. The function takes a line (String) and splits it into
* multiple pairs in the form of "(word,1)" (Tuple2&lt;String, Integer&gt;).
*/
public static final class LineSplitter implements FlatMapFunction<String, Tuple2<String, Integer>> {

@Override
public void flatMap(String value, Collector<Tuple2<String, Integer>> out) {
// normalize and split the line
String[] tokens = value.toLowerCase().split("\\W+");

// emit the pairs
for (String token : tokens) {
if (token.length() > 0) {
out.collect(new Tuple2<String, Integer>(token, 1));
}
}
}
}
}

类似的例子,官方也有提供的,可以在这里下载:
WordCount官方推荐

运行

本地右键运行:
f642c8bf60959ab7c9544bff44882121-本地环境搭建&构建第一个Flink应用.resources/8F0D8EF2-5C0B-4067-AA87-31D7A0DC16C7.png)

提交到本地单机Flink上

  • 进入工程目录,使用以下命令打包
    1
    mvn clean package -Dmaven.test.skip=true

然后,进入 flink 安装目录 bin 下执行以下命令提交程序:

1
flink run -c org.myorg.laowang.WordCount /Users/wangzhiwu/WorkSpace/quickstart/target/quickstart-0.1.jar

分别制定main方法和jar包的地址。

在刚才的控制台中,可以看到:
ffabc914659360af98a6a359c704281a-本地环境搭建&构建第一个Flink应用.resources/EB619900-BBDE-4E32-9089-0DC867FF9220.png)
我们刚才提交过的程序。

flink的log目录下有我们提交过的任务的日志:
857dd4a1b3017866327e73acd46b86f5-本地环境搭建&构建第一个Flink应用.resources/620369FB-ABCA-4184-AA90-C7FEDB114B07.png)

总结

一次简单的flink之旅就完成了。

坚持原创技术分享,您的支持将鼓励我继续创作!