分类
在分类问题中,可以将某个域中的每个实体置于一组离散的类别中的一个中:是/否,朋友/敌人,好/坏/无所谓,蓝色/红色/绿色等。
给定一个带有标签的实体的训练集,制定一个将标签分配给测试集中的实体的规则。
在分类问题中,可以将某个域中的每个实体置于一组离散的类别中的一个中:是/否,朋友/敌人,好/坏/无所谓,蓝色/红色/绿色等。
给定一个带有标签的实体的训练集,制定一个将标签分配给测试集中的实体的规则。
Hadoop 是一个开发和运行大规模数据分析程序的软件平台,隶属 Apache 的一个开源软件框架,在大量普通服务器组成的集群中对海量数据进行分布式计算。
主要模块:
-ROOT-
表开始查找。<key, value>
的 key 必须实现WritableComparable
Namenode,JobTracker, Secondary NameNode
能说明 Hadoop 主节点启动成功数据挖掘是什么?
发现具有以下特征的模式(模型):
- 有效性
- 可用性
- 出乎意料
- 可理解性
什么是数据挖掘:在大量数据的情况下发现数据的有效的,可用的,新的,可理解的模式
数据挖掘的常见任务:
嵌入式系统定义、应用(至少五种)、结构、特点
定义:
蓝海战略:通过根本性的差异化来创造全新的行业,而不是模仿现有商业模式在当前行业中竞争
蓝海战略的“四项行动架构”(增加价值,减少成本)
GUI 测试脚本录制与回放:
移动平台的碎片化问题:平台多样、操作系统版本、品牌、型号、屏幕尺寸分辨率……
题型:填空题、不定项选择、判断题、两道简答题
- 云计算概念
- 发展现状:概念普及度、云产品丰富度、云应用广泛性、市场规模等
- 相对传统分布式集群、个人持有计算资源有何优势:降低计算成本、提高资源利用率
- 和大数据、人工智能、物联网、互联网+等技术的关系?:提供算力、存储和网络资源
- 面临的挑战——也是持续优化和发展的推动力
- 开源之于云计算
- 云计算架构
- 极致的面向服务的计算架构:一切资源以服务的形式对外开放
- 概念架构:二维视角(前端+后端,关注“云”功能)
- 逻辑架构:“云体+云栈”(技术体系结构,关注如何实现“云”)
- 物理架构:云数据中心(建筑、设备、网络、能耗、安全)+云操作系统(如 OpenStack, CloudStack,Eucalyptus 等)
- 云数据中心:网络拓扑,绿色节能技术,自动化与容灾备份技术
- 虚拟化技术:虚拟化层次,云数据中心的虚拟化,虚拟机迁移策略
- 云操作系统:OpenStack 及其各组件
云计算是一种商业模式、一种计算范式、一种具体实现方式。计算、存储、网络和安全是云计算的四个关键技术。在很多应用场景下,云计算解决了其他方式无法解决的实际的应用需求。