ImageVerifierCode 换一换
格式:DOCX , 页数:6 ,大小:310.83KB ,
资源ID:742975      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-742975-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2022高中信息技术 基础知识综合复习 优化集训13 常用表格数据的处理 大数据处理的基本思想与框架.docx)为本站会员(a****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至kefu@ketangku.com或直接QQ联系客服),我们立即给予删除!

2022高中信息技术 基础知识综合复习 优化集训13 常用表格数据的处理 大数据处理的基本思想与框架.docx

1、优化集训13常用表格数据的处理大数据处理的基本思想与框架1.数据处理的核心是,在数据分析、挖掘前通常先对数据进行。2.数据整理时一般采用、或来填充缺失值。3.下列软件中可用于数据统计分析的是(多选,填序号)SPSSExcelPhotoshopSASFlashMATLABGoldWaveRPythonJava4.Excel中对某工作表的C10单元格进行公式计算,下列可能是该单元格的计算公式的是()A.SUM(C2C9)B.=A10+C10C.AVERAGE(C2:C9)D.=MAX(C2:C9)5.下图为Excel中存储的“2012年主要城市入境游接待人数构成情况”的相关数据。请回答下列问题:(

2、1)B31单元格中存储了所有主要城市的外国人人数之和,C31:E31区域的值通过B31单元格自动填充得到,则B31单元格的公式为:(2)C32单元格中存储了所有主要城市香港同胞人数的总和在所有主要城市入境游接待人数之和中所占的百分比(%)数据,D32:E32区域的值通过C32单元格自动填充得到,则C32单元格的公式为:(3)需要分析“上海、北京、杭州三地港澳台游客构成情况”,以A2:A5,C2:E5为数据源创建图表,应选择以下(单选,填字母)选项的图(填写图表类型)。上海、北京、杭州三地港澳台游客构成情况A上海、北京、杭州三地港澳台游客构成情况B上海、北京、杭州三地港澳台游客构成情况C上海、北

3、京、杭州三地港澳台游客构成情况D(4)分析上题中图表可知澳门同胞最喜欢去(单选,填字母:A.上海/B.北京/C.杭州)旅游。最喜欢去上海旅游的是(单选,填字母:A.香港/B.澳门/C.台湾)同胞。6.下图为Excel中存储的“20012006部分国家年均PM10浓度统计表”的相关数据。请问答下列问题:(1)B40单元格中存储了当前工作表中所有国家2001年的平均值,C40:G40区域的值通过B40单元格自动填充得到,则B40单元格的公式为:(2)B41单元格中存储了当前工作表中所有国家2001年的最大值,C41:G41区域的值通过B41单元格自动填充得到,则B41单元格的公式为:(3)B42单

4、元格中存储了当前工作表中所有国家2001年的最小值,C42:G42区域的值通过B42单元格自动填充得到,则B42单元格的公式为:(4)H4单元格中存储了中国2006年PM10的浓度和表中所有国家平均值的差值,H5:H39区域的值通过H4单元格自动填充得到,则H4单元格的公式为:(5)需要分析“中、印、俄、巴四国年均PM10浓度对比情况”,以B15:H17,B40:H41为数据源创建下方图表。新兴经济体国家(中国、印度、俄罗斯联邦、巴西)年均PM10浓度对比图(20012006)上述图表类型为图。从图表可知,在新兴经济体国家中PM10年均浓度下降幅度最大的国家是。7.大数据处理采用思想:把复杂问

5、题分成两个或多个相似问题,求解子问题后,再用合适方法将其成求解整个问题的解法。8.大数据处理类型如下图所示,请在图中空白处填上相应的内容。9.是一个可运行于大规模计算机集群上的系统基础架构,适用于静态数据的批处理计算。10.HDFS的主要功能是将大规模海量数据以的形式、用多个副本保存在不同的存储节点中,并用进行管理。是一个的系统,适合部署在廉价的机器上(云盘、网盘的底层一般采用HDFS)。11.分布式数据库HBase建立在HDFS提供的底层存储基础上,采用的存储方式,主要用来存储数据和数据,可管理PB级的大数据。12.分布式并行计算模型是一种分布式并行编程模型,能够处理大规模数据集的,主要由(

6、映射)和(归纳)2个函数构成。13.流计算系统可以简单、高效、可靠地实现的获取、传输和存储,在与数据库、Hadoop、编程语言等整合后可开发出功能强大的应用。优化集训13常用表格数据的处理大数据处理的基本思想与框架1.数据整理2.平均值中间值概率统计值3.解析Photoshop是图像处理软件;Flash是二维动画制作软件;GoldWave是音频处理软件。4.D解析A.Excel中的区域用冒号分隔左上角单元格名和右下角单元格名;B.公式当中不能出现结果单元格自身;C.缺少标志公式计算的等号。5.(1)=SUM(B3:B30)(2)=C31/SUM($B31:$E31)* 100解析横向自动填充,

7、默认发生相对引用,被填充单元格的列号相对样板单元格发生改变,而公式中的分母B31与E31单元格不能变化,所以将分母B31与E31单元格的列号B与E加上$锁定不让它发生改变。(3)C柱形(4)CC6.(1)=AVERAGE(B4:B39)(2)=MAX(B4:B39)(3)=MIN(B4:B39)(4)=G4-G$40解析纵向自动填充,默认发生相对引用,被填充单元格的行号相对样板单元格发生改变,而公式中存储了平均值的G40单元格不能变化,所以将其行号40加上$锁定不让它发生改变。(5)折线印度7.分治组合8.静态流图9.Hadoop分布式10.分布式文件系统文件分布式系统高度容错性11.基于列非结构化半结构化12.并行运算MapReduce13.实时数据实时计算与分析

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1