新型数据:图数据
社交网络 | 媒体网络 |
---|---|
信息网络 | 信息网络 |
技术网络 | |
Hadoop 是一个开发和运行大规模数据分析程序的软件平台,隶属 Apache 的一个开源软件框架,在大量普通服务器组成的集群中对海量数据进行分布式计算。
主要模块:
-ROOT-
表开始查找。<key, value>
的 key 必须实现WritableComparable
Namenode,JobTracker, Secondary NameNode
能说明 Hadoop 主节点启动成功数据挖掘是什么?
发现具有以下特征的模式(模型):
- 有效性
- 可用性
- 出乎意料
- 可理解性
什么是数据挖掘:在大量数据的情况下发现数据的有效的,可用的,新的,可理解的模式
数据挖掘的常见任务:
嵌入式系统定义、应用(至少五种)、结构、特点
定义:
蓝海战略:通过根本性的差异化来创造全新的行业,而不是模仿现有商业模式在当前行业中竞争
蓝海战略的“四项行动架构”(增加价值,减少成本)
GUI 测试脚本录制与回放:
移动平台的碎片化问题:平台多样、操作系统版本、品牌、型号、屏幕尺寸分辨率……
题型:填空题、不定项选择、判断题、两道简答题
- 云计算概念
- 发展现状:概念普及度、云产品丰富度、云应用广泛性、市场规模等
- 相对传统分布式集群、个人持有计算资源有何优势:降低计算成本、提高资源利用率
- 和大数据、人工智能、物联网、互联网+等技术的关系?:提供算力、存储和网络资源
- 面临的挑战——也是持续优化和发展的推动力
- 开源之于云计算
- 云计算架构
- 极致的面向服务的计算架构:一切资源以服务的形式对外开放
- 概念架构:二维视角(前端+后端,关注“云”功能)
- 逻辑架构:“云体+云栈”(技术体系结构,关注如何实现“云”)
- 物理架构:云数据中心(建筑、设备、网络、能耗、安全)+云操作系统(如 OpenStack, CloudStack,Eucalyptus 等)
- 云数据中心:网络拓扑,绿色节能技术,自动化与容灾备份技术
- 虚拟化技术:虚拟化层次,云数据中心的虚拟化,虚拟机迁移策略
- 云操作系统:OpenStack 及其各组件
云计算是一种商业模式、一种计算范式、一种具体实现方式。计算、存储、网络和安全是云计算的四个关键技术。在很多应用场景下,云计算解决了其他方式无法解决的实际的应用需求。
出发点:提升 UNIX 操作系统的可靠性
技术构想: