1、在demo文件夹下新建作业mysql_hdfs2
2、 洧粽袄淖配置mysql连接,我们既可以在使用组件时进行配置,也可以先提前在元数据中配置好各种数据库连接,然后直接拖到工作区使用。配置步骤如下在元数据中新建mysql 连接
3、填写mysql连接信息
4、如下图,已经连接成功。
5、开始拖拽组件,把mysql连接拖放到设计工作区,选择组件 “tDBInput(MySQL)”
6、点击工作却mysql的图标,选择 “组件”,表填写MySQL中刚才写入表valid_movie,查询语句补充完整,“s髫潋啜缅elect * from valid_movie”,点击“Guess schema”
7、之后会出现这张表的字段和类型。你可以修改字段名/选择保留的字段等。
8、在右侧搜索tLogRow,这个组件相当于输出,可以显示我们的数据
9、左侧找到刚勺阊扌靡刚添加的hdfs连接,拖放到设计工作区,在弹出的组件选择框中选择HDFSOutPut组件,然后设置hdfs 存储文件的位置,文件名称,文件类型(序列化或者文本文件),动作(重写/追加)
10、把三个组件进行连接
11、valid_movie表内容打印在控制台上
12、HDFS也有了表中的数据,表示mysql-hdfs 数据转移成功。