1、蚧蝾胖垂熟练使用SQL语言;2、熟练使用Hadoop、M/R、Hive、Storm等开发工具;3、熟悉Linux命令及Shell编程;4、对数据敏感,良好的逻辑分析能力,良好沟通能力和团队精神;5、熟悉Impala、Druid、Mdrill、ElasticSearch等大数据工具者优先;
2、(1)Java语言基础(2) HTML、CSS与JavaScript(3)JavaWeb和数据库阶段二、 Linux&Hadoop生态体系Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架
3、阶段三、 分布式倦虺赳式计算框架和Spark&Strom生态体系(1)分布式计算框架Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算、实战一:基于Spark的推荐系统(某一线公司真实项目)、实战二:新浪网(www.sina.com.cn)(2)storm技术架构体系Storm原理与基础、消息队列kafka、Redis工具、zookeeper详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战
4、阶段四、 大数据项目实战(一线公司真实项目)数据获取、数据处理、数据分析、数据展现、数据应用阶段五、 大数据分析 —AI(人工智能)Data Analyze工作环境准备&数据分析基础、数据可视化、Python机器学习
5、越来越多的行业对大数据应用持乐观的态度,大数据或者相关数据分析解决方案的使用在互联网行业,比如百度、腾讯、淘宝、新浪等公司已经成为标准。而像电信、金融、能源这些传统行业,越来越多的用户开始尝试或者考虑怎么样使用大数据解决方案,来提升自己的业务水平。