1、java基础:1. Java 语言的发展史、java 开发环境搭建以及环境变量的配置,java 语言廊蛹混庞跨平台的原理,java 程序初次开发2. Java 语法格式,关键字,标识符,注释,常量,数据类型,数据类型转换,运算符3. 程序流程控制语句以及其应用场景4. 数组的应用及其常见操作5. 类和对象的概念、类和对象之间的关系6. 类的组成部分(成员变量,构造方法,成员方法)及其详细讲解7. 面向对象的三大特性:继承、封装 及其特点剖析8. 接口和抽象类及其特点分析9. java 的异常处理机制10. jdk API 常用类的讲解:Math,Random、String,StringBuffer,Date11. Java I/O 体系介绍:File 类的介绍和常用操作,字节流 InputStream 和OutputStream,字符流 Reader 和 Writer,以及相应实现类的介绍和使用,缓冲流和序列化流的的详解,IO 性能分析,字节和字符的转化流,包装流的概念,以及常用包装类。
2、大数据必备的数据结构与算法:1. 数据结构和算法埂琴逾癌概述2. 数组、链表、队列、栈等线性表3. 二叉树、BST、AVL 树及二叉树的递归与非递归遍历4. B+5. 跳表6. 图、图的存储、图的遍历7. 有向图、无向图、懒惰与积极的普利姆算法、克鲁斯卡尔算法及 MST、单源最短路径问题及 Dijkstra 算法8. 并查集与索引式优先队列、二叉堆9. 遗传算法初步与 TSP 问题10. 内部排序(直接插入、选择、希尔、堆排序、快排、归并等)算法与实践中的优化11. 外部排序与优化(文件编码、数据编码、I/O 方式与 JVM 特点、多线程、多路归并等)12. 哈希表、Trie 树、倒排索引、分布式索引初步(Map-Reduce)
3、硬技能 - Linux 必知必会:(主要为了学习后面大数据的组件)1. Linux 系统概述2. 系统安装及相关配置3. Linux 网络基础4. OpenSSH 实现网络安全连接5. vi 文本编辑器6. 用户和用户组管理7. 磁盘管理8. Linux 文件和目录管理9. Linux 终端常用命令10. linux 系统监测与维护
4、Hadoop 大数据开发技术:hadoop、hive、hbase、hue、oozie、flume等生态圈相关软件的使用;MapReduce几个案例 :最短路径算法,PageRank算法,社交好友推荐算法等几个 比较常用的算法。