第1章 大数据概述第1章单元测验1、下面关于数据的说法,错误的是:
a、数据的根本价值在于可以为人们找出答案
b、数据的价值会因为不断使用而削减
c、数据的价值会因为不断重组而产生更大的价值
d、目前阶段,数据的产生不以人的意志为转移
2、第3次信息化浪潮的标志是:
a、个人计算机的普及
b、互联网的普及
c、云计算、大数据和物联网技术的普及
d、人工智能的普及
3、物联网的发展最终导致了人类社会数据量的第三次跃升,使得数据产生方式进入了:
a、手工创建阶段
b、运营式系统阶段
c、用户原创内容阶段
d、感知式系统阶段
4、英国的大数据发展战略是:
a、稳步实施“三步走”战略,打造面向未来的大数据创新生态
b、通过发展创新性k8凯发的解决方案并应用于实践来促进大数据发展
c、以大数据等技术为核心应对第四次工业革命
d、紧抓大数据产业机遇,应对脱欧后的经济挑战
5、以下哪个不是大数据的“4v”特性:
a、数据量大
b、数据类型繁多
c、处理速度快
d、价值密度高
6、数据的类型主要包括:
a、文本
b、图片
c、音频
d、视频
7、计算机系统中的数据组织形式主要有两种,分别是:
a、文件
b、视频
c、音频
d、数据库
8、为了让数据变得可用,需要对数据进行三个步骤的处理,分别是:
a、数据清洗
b、数据抽样
c、数据管理
d、数据分析
9、信息科技为大数据时代提供技术支撑,主要体现在哪三个方面:
a、存储设备容量不断增加
b、cpu处理能力大幅提升
c、量子计算机全面普及
d、网络带宽不断增加
10、人类社会的数据产生方式大致经历了哪三个阶段:
a、手工生产阶段
b、运营式系统阶段
c、用户原创内容阶段
d、感知式系统阶段
11、关于“大数据摩尔定律”,以下说法正确的是:
a、人类社会产生的数据一直都在以每年50%的速度增长
b、人类社会的数据量大约每两年就增加一倍
c、人类在最近两年产生的数据量相当于之前产生的全部数据量之和
d、人类社会的数据量以每年10%的速度增长
12、人类自古以来在科学研究上先后历经了哪几种范式:
a、实验科学
b、理论科学
c、计算科学
d、数据密集型科学
13、大数据将会对社会发展产生深远的影响,具体表现在以下哪几个方面:
a、大数据决策成为一种新的决策方式
b、大数据成为提升国家治理能力的新途径
c、大数据应用促进信息技术与各行业的深度融合
d、大数据开发推动新技术和新应用的不断涌现
14、大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。以下哪些属于大数据产业的某个环节
a、it基础设施层
b、数据源层
c、数据管理层
d、数据分析层
第2章 大数据与云计算、物联网、人工智能第2章单元测验1、早期的云计算产品aws是由哪家企业提出的:
a、ibm
b、微软
c、亚马逊
d、谷歌
2、云计算包括3种类型。面向所有用户提供服务,只要是注册付费的用户都可以使用,这种云计算属于:
a、公有云
b、私有云
c、混合云
d、独立云
3、云计算包括3种类型。只为特定用户提供服务,比如大型企业出于安全考虑自建的云环境,只为企业内部提供服务,这种云计算属于:
a、公有云
b、私有云
c、混合云
d、独立云
4、以下关于大数据、云计算和物联网的区别,描述错误的是:
a、大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活
b、云计算本质上旨在整合和优化各种it资源并通过网络以服务的方式,廉价地提供给用户
c、云计算旨在从海量数据中发现价值,服务于生产和生活
d、物联网的发展目标是实现物物相连,应用创新是物联网发展的核心
5、以下关于机器学习,描述错误的是:
a、是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科
b、研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能
c、机器学习强调三个关键词:算法、模型、训练
d、基于数据的机器学习是现代智能技术中的重要方法之一
6、以下关于知识图谱,描述错误的是:
a、又称为科学知识图谱
b、在图书情报界称为知识域可视化或知识领域映射地图
c、知识图谱属于密码学研究范畴
d、知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域
7、以下关于人机交互,描述错误的是:
a、人机交互是一门研究系统与用户之间的交互关系的学科
b、人机交互界面通常是指用户不可见的部分
c、系统可以是各种各样的机器,也可以是计算机化的系统和软件
d、用户通过人机交互界面与系统交流,并进行操作
8、以下关于计算机视觉,描述错误的是:
a、计算机视觉是一门研究如何使机器“看”的科学
b、是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉
c、计算机视觉是一门综合性的学科
d、语音识别属于计算机视觉的典型应用
9、传统的it资源获取方式的主要缺点是:
a、初期成本高,建设周期长
b、后期需要自己维护,使用成本高
c、it资源供应量有限
d、it资源供应量无限
10、云计算的主要优点是:
a、初期投入大,需要用户自己维护
b、初期零成本,瞬时可获得
c、后期免维护,使用成本低
d、在供应it资源量方面“予取予求”
11、云计算包括哪3种典型的服务模式:
a、iaas(基础设施即服务)
b、paas(平台即服务)
c、maas(机器即服务)
d、saas(软件即服务)
12、云计算包括哪3种类型:
a、公有云
b、独立云
c、私有云
d、混合云
13、从技术架构上看,物联网主要包括哪几层:
a、感知层
b、网络层
c、处理层
d、应用层
14、以下关于大数据、云计算和物联网的联系,描述正确的是:
a、从整体上看,大数据、云计算和物联网这三者是相辅相成的
b、大数据根植于云计算,大数据分析的很多技术都来自于云计算
c、大数据为云计算提供了“用武之地”
d、物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理
15、以下关于大数据与人工智能的联系,描述正确的是:
a、人工智能需要数据来建立其智能,特别是机器学习
b、人工智能应用的数据越多,其获得的结果就越准确
c、大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展
d、大数据技术为人工智能提供了强大的存储能力和计算能力
第3章 大数据技术第3章单元测验1、以下哪个步骤不属于数据的采集与预处理:
a、利用etl工具将分布的、异构数据源中的数据,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中
b、利用日志采集工具把实时采集的数据作为流计算系统的输入,进行实时处理分析
c、利用网页爬虫程序到互联网网站中爬取数据
d、对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据
2、以下哪项不属于数据清洗的内容:
a、一致性检查
b、无效值和缺失值的处理
c、成对删除
d、精确度校验
3、以下哪项不属于传统的数据存储和管理技术:
a、nosql数据库
b、文件系统
c、关系数据库
d、数据仓库
4、以下关于分布式文件系统,描述错误的是:
a、是一种通过网络实现文件在多台主机上进行分布式存储的文件系统
b、所有的分布式文件系统的设计都是采用“客户机/服务器”(client/server)模式
c、谷歌开发了分布式文件系统gfs
d、hadoop分布式文件系统(hadoop distributed file system,hdfs)是针对gfs的开源实现
5、以下描述错误的是:
a、传统的关系数据库可以较好地支持结构化数据存储和管理
b、web 2.0的迅猛发展以及大数据时代的到来,使关系数据库的发展越来越力不从心
c、传统的关系数据库由于数据模型不灵活、水平扩展能力较差等局限性,已经无法满足各种类型的非结构化数据的大规模存储需求
d、传统关系数据库引以为豪的一些关键特性,如事务机制和支持复杂查询,在web 2.0时代成为不可或缺的核心特性
6、以下关于nosql数据库描述错误的是:
a、nosql是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的统称
b、nosql所采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型
c、nosql数据库有固定的表结构,通常存在较多连接操作
d、与关系数据库相比,nosql具有灵活的水平可扩展性,可以支持海量数据存储
7、下面属于批处理技术的是:
a、mapreduce
b、storm
c、spark streaming
d、graphx
8、下面属于流计算技术的是:
a、spark mllib
b、graphx
c、s4
d、hive
9、下面属于图计算技术的是:
a、pregel
b、dremel
c、impala
d、dstream
10、下面属于查询分析计算技术的是:
a、spark streaming
b、storm
c、hive
d、pregel
11、数据采集的三大要点是:
a、全面性
b、多维性
c、高效性
d、精确性
12、数据采集的主要数据源包括:
a、传感器数据
b、互联网数据
c、日志文件
d、企业业务系统数据
13、需要清洗的数据的主要类型包括:
a、残缺数据
b、干净数据
c、错误数据
d、重复数据
14、数据仓库的特性包括:
a、面向主题的
b、集成的
c、相对稳定的
d、反映历史变化的
15、nosql数据库具有以下几个特点:
a、灵活的可扩展性
b、灵活的数据模型
c、与云计算紧密融合
d、数据模型比较死板
16、典型的机器学习和数据挖掘算法包括:
a、分类
b、聚类
c、正交
d、回归分析
17、大数据处理分析技术类型主要包括:
a、批处理计算
b、流计算
c、图计算
d、查询分析计算
18、在大数据时代,可视化技术可以支持实现多种不同的目标,主要包括:
a、观测、跟踪数据
b、分析数据
c、辅助理解数据
d、增强数据吸引力
19、数据安全技术种类繁多,主要包括:
a、身份认证技术
b、防火墙技术
c、访问控制技术
d、可视化技术
第4章 大数据应用第4章单元测验1、下面关于推荐系统的描述错误的是:
a、推荐系统是自动联系用户和物品的一种工具
b、和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算
c、推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求
d、推荐系统是一种只能通过专家进行人工推荐的系统
2、以下推荐方法中,哪一个是基于内容的推荐:
a、由资深的专业人士来进行物品的筛选和推荐
b、基于统计信息进行推荐
c、通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容
d、对多种推荐算法进行有机组合,然后给出推荐结果
3、以下哪项不属于大数据在城市管理中的应用:
a、智能交通
b、环保监测
c、城市规划
d、比赛预测
4、以下哪项不属于大数据在零售领域的应用:
a、大数据征信
b、发现关联购物行为
c、客户群体划分
d、供应链管理
5、一个完整的推荐系统通常包括哪3个组成模块:
a、用户建模模块
b、推荐对象建模模块
c、推荐算法模块
d、可视化模块
6、智慧医疗具有哪些优点:
a、促进优质医疗资源的共享
b、避免患者重复检查
c、促进医疗智能化
d、有助于实现全民免费医疗
7、下面关于智能物流的描述,正确的是:
a、又称智慧物流,是利用智能化技术,使物流系统能模仿人的智能,具有思维、感知、学习、推理判断和自行解决物流中某些问题的能力
b、可以帮助实现物流资源优化调度和有效配置,并且提升物流系统效率
c、智能物流概念源自2010年ibm发布的研究报告《智慧的未来供应链》
d、智能物流概念经历了自动化、信息化、网络化3个发展阶段
8、智能物流具有哪几个方面的重要作用:
a、提高物流的信息化和智能化水平
b、降低物流成本和提高物流效率
c、提高物流活动的一体化
d、提高了物流的复杂性
9、大数据在金融领域的应用主要包括:
a、高频交易
b、市场情绪分析
c、信贷风险分析
d、大数据征信
10、大数据在餐饮行业的应用主要包括:
a、大数据驱动的团购模式
b、利用大数据为用户推荐消费内容
c、利用大数据调整线下门店布局
d、利用大数据控制店内人流量
第5章 大数据安全第5章单元测验1、下面关于大数据安全问题,描述错误的是:
a、大数据的价值并不单纯地来源于它的用途,而更多地源自其二次利用
b、对大数据的收集、处理、保存不当,会加剧数据信息泄露的风险
c、大数据成为国家之间博弈的新战场
d、大数据对于国家安全没有产生影响
2、下面关于棱镜门事件描述错误的是:
a、棱镜计划(prism) 是一项由美国国家安全局(nsa)自2007 年起开始实施的绝密电子监听计划
b、在该计划中,美国国家安全局和联邦调查局利用平台和技术上的优势,开展全球范围内的监听活动
c、该计划的目的是为了促进世界和平与发展
d、该计划对全世界重点地区、部门、公司甚至个人进行布控
3、下面关于手机软件采集个人信息的描述错误的是:
a、在我们的日常生活中,部分手机app往往会“私自窃密”
b、有的app在提供服务时,采取特殊方式来获得用户授权,这本质上仍属“未经同意”
c、在微信朋友圈广泛传播的各种测试小程序是安全的,不会窃取用户个人信息
d、手机app过度采集个人信息呈现普遍趋势,最突出的是在非必要的情况下获取位置信息和访问联系人权限
4、下面描述错误的是:
a、“探针盒子”就是一款自动收集用户隐私的产品
b、许多顾客在使用wifi之后会收到大量的广告信息,甚至自己的手机号码也会被当做信息进行多次买卖
c、在免费上网的背后,其实也存在着不小的信息安全风险,或许一不小心,就落入了电脑黑客们设计的wifi陷阱之中
d、免费wifi都是安全的,可以放心使用
5、传统的数据安全的威胁主要包括:
a、计算机病毒
b、黑客攻击
c、数据信息存储介质的损坏
d、数据复制
6、大数据安全表现出与传统数据安全不同的特征,具体来说包括哪几个方面:
a、大数据成为网络攻击的显著目标
b、大数据加大隐私泄露风险
c、大数据技术被应用到攻击手段中
d、大数据成为高级可持续攻击(apt)的载体
7、大数据保护的基本原则包括:
a、数据主权原则
b、数据保护原则
c、数据自由流通原则
d、数据安全原则
8、大数据时代,可以从哪几个方面加强数据安全与隐私保护:
a、从国家法制层面进行管控
b、从企业端源头进行遏制
c、提高个人意识,应用安全技术
d、数据安全与隐私保护工作,与个人无关,全部需要依赖国家层面进行管控
9、关于世界各国保护数据安全的实践,以下描述正确的是:
a、欧盟推出了gdpr,目的在于遏制个人信息被滥用,保护个人隐私
b、美国是世界上最早提出隐私权并予以法律保护的国家
c、英国在《开放数据白皮书》中专门针对个人隐私保护进行规范
d、新加坡于2012年公布《个人数据保护法》,旨在防范对国内数据以及源于境外的个人资料的滥用行为
10、我国应对大数据安全的主要举措包括:
a、加强顶层设计,引领大数据安全发展
b、构筑信息屏障,禁止跨部门数据流通
c、健全政策法规,防范大数据安全风险
d、构建标准体系,引领大数据规范发展
第6章 大数据思维第6章单元测验1、下面关于机械思维的核心思想,描述错误的是:
a、世界变化的规律是确定的
b、世界变化的规律是无法确定的
c、规律不仅是可以被认识的,而且可以用简单的公式或者语言描述清楚
d、这些规律应该是放之四海而皆准的,可以应用到各种未知领域指导实践
2、我们在使用智能手机进行导航来避开城市拥堵路段时,体现了哪种大数据思维方式:
a、我为人人,人人为我
b、全样而非抽样
c、效率而非精确
d、相关而非因果
3、谷歌采用搜索引擎大数据进行流感趋势预测,体现了哪种大数据思维方式:
a、我为人人,人人为我
b、全样而非抽样
c、效率而非精确
d、相关而非因果
4、“啤酒与尿布”的故事,体现了哪种大数据思维方式:
a、我为人人,人人为我
b、全样而非抽样
c、效率而非精确
d、相关而非因果
5、大数据的简单算法比小数据的复杂算法更有效,体现了哪种大数据思维方式:
a、以数据为中心
b、全样而非抽样
c、效率而非精确
d、相关而非因果
6、迪士尼magicband手环,体现了哪种大数据思维方式:
a、我为人人,人人为我
b、全样而非抽样
c、效率而非精确
d、相关而非因果
7、舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中明确指出,大数据时代最大的转变就是思维方式的3种转变,具体包括:
a、全样而非抽样
b、效率而非精确
c、相关而非因果
d、务实而非务虚
8、下面关于搜索引擎“点击模型”的描述正确的是:
a、随着数据量的积累,点击模型对搜索结果排名的预测越来越准确,它的重要性也越来越大
b、点击模型的准确性取决于数据量的大小
c、一个搜索引擎使用的时间越长,数据的积累就越充分,对于长尾搜索就做得越准确
d、当整个搜索行业都意识到点击数据的重要性后,这个市场上的竞争就从技术竞争变成了数据竞争
第7章 大数据伦理第7章单元测验1、下面关于大数据伦理的描述,错误的是:
a、大数据伦理属于科技伦理的范畴
b、大数据伦理问题是指由于大数据技术的产生和使用而引发的社会问题
c、作为一种新的技术,大数据技术像其他所有技术一样,其本身是无所谓好坏的,而它的“善”与“恶”全然在于对大数据技术的使用者
d、大数据技术本身就存在“善”和“恶”的区分
2、现在的互联网,基于大数据和人工智能的推荐应用越来越多,越来越深入,我们一直被“喂食着”经过智能化筛选推荐的信息,久而久之,会导致什么问题:
a、信息茧房问题
b、隐形偏差问题
c、大数据杀熟问题
d、隐私泄露问题
3、下面哪一个不属于大数据伦理问题:
a、隐私泄露问题
b、数据安全问题
c、数字鸿沟问题
d、数据冗余问题
4、下面关于隐私泄露问题的描述,正确的是:
a、大数据时代下的隐私与传统隐私的最大区别在于隐私的数据化,即隐私主要以“个人数据”的形式出现
b、用户在使用搜索引擎时,搜索引擎可以精确地刻画出该用户的“数字肖像”
c、通过数据预测,可以预测个体“未来的隐私”
d、“数据痕迹”往往永远无法彻底消除,会被永久保留记录
5、下面关于数字鸿沟问题的描述,正确的是:
a、数字鸿沟被认为是信息时代的“马太效应”,即先进技术的成果不能为人公正分享,于是造成“富者越富、穷者越穷”的情况
b、数字鸿沟因为大数据技术的诞生而趋向弥合
c、数字鸿沟是一个涉及公平公正的问题
d、在我国,东中西部地区、城乡之间等都可以明显感受到数字鸿沟的存在
6、下面关于数据独裁的描述,正确的是:
a、所谓的“数据独裁”是指在大数据时代,由于数据量的爆炸式增长,导致做出判断和选择的难度徒增,迫使人们必须完全依赖数据的预测和结论才能做出最终的决策
b、从某个角度来讲,数据独裁就是让数据统治人类,使人类彻底走向唯数据主义
c、数据独裁最终将导致人类思维被“空心化”,进而是创新意识的丧失
d、数据独裁还可能使人们丧失了人的自主意识、反思和批判的能力,最终沦为数据的奴隶
7、因数据而产生的垄断问题,主要包括哪几种类型:
a、数据可能造成进入壁垒或扩张壁垒
b、拥有大数据形成市场支配地位并滥用
c、因数据产品而形成市场支配地位并滥用
d、涉及数据方面的垄断协议
8、大数据伦理问题产生的原因主要包括:
a、人类社会价值观的转变
b、数据伦理责任主体不明确
c、相关主体的利益牵涉
d、道德规范的缺失
第8章 数据共享第8章单元测验1、下面关于政府数据孤岛描述错误的是:
a、有些政府部门错误地将数据资源等同于一般资源,认为占有就是财富,热衷于搜集,但不愿共享
b、有些部门只盯着自己的数据服务系统,结果因为数据标准、系统接口等技术原因,无法与外单位、外部门联通
c、有些地方,对大数据缺乏顶层设计,导致各条线、各部门固有的本位主义作祟,壁垒林立,数据无法流动
d、即使涉及到工作机密、商业机密,政府也应该毫不保留地共享数据
2、关于推进数据共享开放的描述,错误的是:
a、要改变政府职能部门“数据孤岛”现象,立足于数据资源的共享互换,设定相对明确的数据标准,实现部门之间的数据对接与共享
b、要使不同省区市之间的数据实现对接与共享,解决数据“画地为牢”的问题,实现数据共享共用
c、在企业内部,破除“数据孤岛”,推进数据融合
d、不同企业之间,为了保护各自商业利益,不宜实现数据共享
3、企业数据孤岛产生的原因主要包括哪两个方面:
a、以功能为标准的部门划分导致数据孤岛
b、不同类型、不同版本的信息化管理系统导致数据孤岛
c、机构设置不合理
d、各个部门责权利不清晰
4、消除数据孤岛对于政府具有哪些重要的意义:
a、有助于提升资源利用率
b、有助于推动政府转型
c、有助于提高行政效率
d、有助于促进跨部门合作
5、消除数据孤岛对于企业具有哪些重要的意义:
a、有助于企业做出有利于生产要素组合优化的决策,使企业能够合理配置资源,实现企业利益最大化
b、有利于企业获得更好的经营发展能力
c、企业信息的增多可以增加做出正确选择的能力,从而提高经济效率
d、不利于企业长远的发展
6、实现数据共享,在政府层面面临的挑战包括:
a、不愿共享开放
b、不敢共享开放
c、不会共享开放
d、数据中心共享开放作用不强
7、实现数据共享,在企业层面面临的挑战包括:
a、系统孤岛挑战
b、组织架构挑战
c、数据合作挑战
d、利润风险挑战
第9章 数据开放第9章单元测验1、下面关于数据权的描述,错误的是:
a、数据权的概念发起于英国,主要将其视为信息社会的一项基本公民权利
b、数据权包括两个方面:数据主权和数据权利
c、数据主权的主体是国家,是一个国家独立自主对本国数据进行管理和利用的权力
d、数据主权的主体是公民,是相对应于公民数据采集义务而形成的对数据利用的权利
2、下面关于政府信息公开与政府数据开放的描述,错误的是:
a、政府信息公开与政府数据开放是一对既相互区别又相互联系的概念
b、信息是没有经过任何加工与解读的原始记录,没有明确的含义,而数据则是经过加工处理并被赋予一定含义的
c、政府信息公开主要是为了对公众知情权的满足而出现的
d、政府数据开放强调的是数据的再利用,公众可以分享数据利用创造的经济和社会价值
3、八国集团开放数据宪章明确了5大原则,以下哪个不属于5大原则:
a、开放数据成为规则
b、注重数量和质量
c、只让部分人拥有数据
d、为改善治理发布数据
4、关于公民的隐私权,下面描述错误的是:
a、修改权是隐私权利人具有的依法了解自身信息资料是否被行政主体利用的权利
b、支配权是隐私权利人的基本权利之一,隐私权利人对自己的个人信息的收集、储存、传播、使用、开放等享有支配权
c、保障权是指公民有权要求政府在数据开放的过程中保障涉及其个人隐私的信息资料不被开放、不被滥用和不被泄露
d、救济权是公民在自身的合法权益受到侵害时,按照法定程序采取法律手段维护自身权益的权利
5、关于我国政府的数据开放,下面描述错误的是:
a、虽然我国各地先后成立了数据管理机构,但是条块分割问题严重
b、省、市、区级数据管理机构缺乏有效的协调管理机制
c、部门与部门之间存在信息不对称、利益冲突、缺乏交流合作
d、中央已经建立统一的组织机构进行管理,已经对全国进行统一调度和规划
6、关于政府数据开放的意义,下面描述正确的是:
a、政府开放数据有利于促进开放透明政府的形成
b、政府开放数据有利于创新创业和经济增长
c、政府开放数据有利于社会治理创新
d、政府开放数据将会对政府正常运作产生威胁
7、国外从政府信息资源开发利用到开放数据发展分为三个时期,具体包括:
a、手动开放数据阶段
b、被动开放数据阶段
c、主动开放数据阶段
d、挖掘数据价值阶段
8、国外政府在以下哪几个方面探索政府开放数据:
a、政府开放数据的范围,即政府开放数据程度上应把握的分寸
b、政府开放数据的开放许可证,即由谁来负责政府数据的开放
c、政府开放数据后的数据安全,即如何避免数据关联后带来的新风险
d、政府开放数据的质量,即如何减少不同部门由于统计口径不同而带来的数据不一致的问题
9、关于国外政府开放数据的特点,以下描述正确的是:
a、出台战略和政策,以一定的格式开放政府数据,使开放数据称为默认的规则
b、纷纷建设开放数据门户,分类开放数据集
c、注重数据的再利用,采取鼓励措施激发企业和创新者利用数据开发更多应用,促进经济增长和就业
d、通过示范和典型案例引导数据的开放和开发利用
10、我国政府数据开放制度体系包括哪几个方面的制度:
a、监督制度
b、行为制度
c、保障制度
d、内容制度
11、我国当前数据开放存在的主要问题包括:
a、数据开放存在安全性问题
b、数据开放面临隐私权和知情权的冲突
c、政策与立法已经比较完善
d、缺乏统一的数据管理机构,各自为政
12、关于我国政府开放数据的描述正确的是:
a、开放数据是技术、政策、文化三位一体的系统工程
b、发布机器可读的高价值数据和推动数据开发利用是当前数据开放的重点
c、加大数据使用、安全和隐私保护等法律法规和规则的制定,以更好地迎接开放数据带来的挑战
d、推进数据开放过程中应该注重政府和民间的合作
第10章 大数据交易第10章单元测验1、关于大数据交易在发展过程中遇到的问题,下面描述错误的是:
a、互联网数据马太效应显现
b、市场信用体系缺失、监管有待加强
c、大数据交易规则和标准缺乏
d、数据质量评价与估值定价已经很完善
2、目前大数据交易市场上存在很多种定价机制,但是不包括以下哪项:
a、平台预定价
b、自动计价
c、拍卖式定价
d、随机性定价
3、我国首家大数据交易所是:
a、贵阳大数据交易所
b、上海数据交易中心
c、华东江苏大数据交易中心
d、浙江大数据交易中心
4、目前进行数据交易的形式主要包括哪几种:
a、大数据交易公司
b、数据交易所
c、api 模式
d、ppt模式
5、大数据交易平台的类型主要包括哪两种:
a、综合数据服务平台
b、实时数据交易平时
c、零散数据交易平台
d、第三方数据交易平台
6、交易数据的来源主要包括哪些:
a、政府公开数据
b、企业内部数据
c、数据供应方数据
d、网页爬虫数据
7、交易产品的类型主要包括哪几种:
a、api
b、数据包
c、云服务
d、k8凯发的解决方案
8、大数据交易平台的运营模式主要包括哪两种:
a、具有交易实时显示功能的交易平台
b、兼具中介和数据处理加工功能的交易平台
c、只具备中介功能的交易平台
d、只具备数据处理加工功能的交易平台
9、可以从哪些维度评价数据价值:
a、数据样本量
b、数据品种
c、数据完整性
d、数据实时性
第11章 大数据治理第11章单元测验1、关于数据治理的职能,下面描述错误的是:
a、从决策的角度,数据治理的职能是“决定如何做决定”
b、数据治理必须回答决策过程中所遇到的问题,即为什么、什么时间、在哪些领域、由谁做决策
c、从具体活动的角度,数据治理的职能是“评估、指导和监督”
d、从决策的角度,数据治理的职能是“如何避免做出错误决定”
2、关于大数据治理与数据治理的关系,下面描述错误的是:
a、大数据治理和数据治理的目的不同
b、大数据治理和数据治理的权利层次不同
c、大数据治理和数据治理的对象相同
d、大数据治理和数据治理解决的实际问题相同
3、下面关于大数据治理要素的描述错误的是:
a、目标要素是大数据治理的预期成果,提出了大数据治理的需求
b、目标要素是影响大数据治理成效的直接决定因素
c、核心要素包括数据质量管理、数据生命周期、数据安全与隐私
d、支持要素包括大数据技术架构、主数据、元数据和审计、日志与报告
4、以下哪个不属于大数据治理模型:
a、isaca数据治理模型
b、hesa数据治理模型
c、数据治理螺旋模型
d、数据治理提升模型
5、在大数据治理中,以下哪个不属于流程管理的具体工作:
a、做好事前预防
b、加强事中监测
c、进行事后评估和整改
d、加强流程考核
6、关于数据治理与数据管理的关系,下面描述正确的是:
a、治理和管理是完全不同的活动
b、管理负责对管理活动进行评估、指导和监督,而治理根据治理所作的决策来具体计划、建设和运营
c、理性的治理主体通常追求治理效率
d、理性的管理主体追求经营效率
7、在宏观层,大数据治理的概念包括哪两个方面:
a、概念体系
b、理念体系
c、体系框架
d、制度框架
8、在中观层,大数据治理的概念表现在三个层面:
a、管理机制
b、信息治理计划
c、数据全面质量管理的部署
d、具体的经济有效的管理策略和过程
9、在微观层,大数据治理的概念包括三个层面:
a、数据全面质量管理的部署
b、具体的经济有效的管理策略和过程
c、大数据治理是使用传统的数据质量维度的方法来测评数据质量和数据的可用性
d、技术工具应用的大数据治理行为
10、数据治理的重要作用包括哪几个方面:
a、促进服务创新和价值创造
b、提升数据管理和决策水平
c、提高数据质量,增强数据可信度,降低成本
d、提高合规监管和安全控制,降低风险
11、大数据治理要素包括哪几个方面:
a、目标要素
b、促成要素
c、核心要素
d、支持要素
12、数据治理组织架构主要包括哪几个部分:
a、数据治理委员会
b、数据治理工作组
c、数据主管
d、数据执行主任
大数据导论期末考试大数据导论期末试卷1、第2次信息化浪潮的标志是:
a、个人计算机的普及
b、互联网的普及
c、云计算、大数据和物联网技术的普及
d、人工智能的普及
2、web2.0的出现导致了人类社会数据量的第二次跃升,使得数据产生方式进入了:
a、手工创建阶段
b、运营式系统阶段
c、用户原创内容阶段
d、感知式系统阶段
3、韩国的大数据发展战略是:
a、稳步实施“三步走”战略,打造面向未来的大数据创新生态
b、通过发展创新性k8凯发的解决方案并应用于实践来促进大数据发展
c、以大数据等技术为核心应对第四次工业革命
d、紧抓大数据产业机遇,应对脱欧后的经济挑战
4、云计算包括3种类型。面向所有用户提供服务,只要是注册付费的用户都可以使用,这种云计算属于:
a、公有云
b、私有云
c、混合云
d、独立云
5、以下关于大数据、云计算和物联网的区别,描述错误的是:
a、大数据侧重于对海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活
b、云计算本质上旨在整合和优化各种it资源并通过网络以服务的方式,廉价地提供给用户
c、云计算旨在从海量数据中发现价值,服务于生产和生活
d、物联网的发展目标是实现物物相连,应用创新是物联网发展的核心
6、以下关于人机交互,描述错误的是:
a、人机交互是一门研究系统与用户之间的交互关系的学科
b、人机交互界面通常是指用户不可见的部分
c、系统可以是各种各样的机器,也可以是计算机化的系统和软件
d、用户通过人机交互界面与系统交流,并进行操作
7、以下哪项不属于数据清洗的内容:
a、一致性检查
b、无效值和缺失值的处理
c、成对删除
d、精确度校验
8、以下哪项不属于传统的数据存储和管理技术:
a、nosql数据库
b、文件系统
c、关系数据库
d、数据仓库
9、下面关于推荐系统的描述错误的是:
a、推荐系统是自动联系用户和物品的一种工具
b、和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算
c、推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求
d、推荐系统是一种只能通过专家进行人工推荐的系统
10、下面关于手机软件采集个人信息的描述错误的是:
a、在我们的日常生活中,部分手机app往往会“私自窃密”
b、有的app在提供服务时,采取特殊方式来获得用户授权,这本质上仍属“未经同意”
c、在微信朋友圈广泛传播的各种测试小程序是安全的,不会窃取用户个人信息
d、手机app过度采集个人信息呈现普遍趋势,最突出的是在非必要的情况下获取位置信息和访问联系人权限
11、谷歌采用搜索引擎大数据进行流感趋势预测,体现了哪种大数据思维方式:
a、我为人人,人人为我
b、全样而非抽样
c、效率而非精确
d、相关而非因果
12、下面哪一个不属于大数据伦理问题:
a、隐私泄露问题
b、数据安全问题
c、数字鸿沟问题
d、数据冗余问题
13、关于推进数据共享开放的描述,错误的是:
a、要改变政府职能部门“数据孤岛”现象,立足于数据资源的共享互换,设定相对明确的数据标准,实现部门之间的数据对接与共享
b、要使不同省区市之间的数据实现对接与共享,解决数据“画地为牢”的问题,实现数据共享共用
c、在企业内部,破除“数据孤岛”,推进数据融合
d、不同企业之间,为了保护各自商业利益,不宜实现数据共享
14、下面关于数据权的描述,错误的是:
a、数据权的概念发起于英国,主要将其视为信息社会的一项基本公民权利
b、数据权包括两个方面:数据主权和数据权利
c、数据主权的主体是国家,是一个国家独立自主对本国数据进行管理和利用的权力
d、数据主权的主体是公民,是相对应于公民数据采集义务而形成的对数据利用的权利
15、我国首家大数据交易所是:
a、贵阳大数据交易所
b、上海数据交易中心
c、华东江苏大数据交易中心
d、浙江大数据交易中心
16、计算机系统中的数据组织形式主要有两种,分别是:
a、视频
b、文件
c、音频
d、数据库
17、信息科技为大数据时代提供技术支撑,主要体现在哪三个方面:
a、存储设备容量不断增加
b、cpu处理能力大幅提升
c、量子计算机全面普及
d、网络带宽不断增加
18、人类社会的数据产生方式大致经历了哪三个阶段:
a、运营式系统阶段
b、手工生产阶段
c、用户原创内容阶段
d、感知式系统阶段
19、关于“大数据摩尔定律”,以下说法正确的是:
a、人类社会产生的数据一直都在以每年50%的速度增长
b、人类社会的数据量大约每两年就增加一倍
c、人类在最近两年产生的数据量相当于之前产生的全部数据量之和
d、人类社会的数据量以每年10%的速度增长
20、云计算的主要优点是:
a、初期投入大,需要用户自己维护
b、初期零成本,瞬时可获得
c、后期免维护,使用成本低
d、在供应it资源量方面“予取予求”
21、云计算包括哪3种典型的服务模式:
a、iaas(基础设施即服务)
b、paas(平台即服务)
c、maas(机器即服务)
d、saas(软件即服务)
22、以下关于大数据与人工智能的联系,描述正确的是:
a、人工智能需要数据来建立其智能,特别是机器学习
b、人工智能应用的数据越多,其获得的结果就越准确
c、大数据为人工智能提供了海量的数据,使得人工智能技术有了长足的发展
d、大数据技术为人工智能提供了强大的存储能力和计算能力
23、数据采集的三大要点是:
a、全面性
b、多维性
c、高效性
d、精确性
24、nosql数据库具有以下几个特点:
a、灵活的可扩展性
b、灵活的数据模型
c、与云计算紧密融合
d、数据模型比较死板
25、典型的机器学习和数据挖掘算法包括:
a、分类
b、聚类
c、正交
d、回归分析
26、大数据处理分析技术类型主要包括:
a、批处理计算
b、流计算
c、图计算
d、查询分析计算
27、一个完整的推荐系统通常包括哪3个组成模块:
a、用户建模模块
b、推荐对象建模模块
c、推荐算法模块
d、可视化模块
28、大数据安全表现出与传统数据安全不同的特征,具体来说包括哪几个方面:
a、大数据成为网络攻击的显著目标
b、大数据加大隐私泄露风险
c、大数据技术被应用到攻击手段中
d、大数据成为高级可持续攻击(apt)的载体
29、关于世界各国保护数据安全的实践,以下描述正确的是:
a、欧盟推出了gdpr,目的在于遏制个人信息被滥用,保护个人隐私
b、美国是世界上最早提出隐私权并予以法律保护的国家
c、英国在《开放数据白皮书》中专门针对个人隐私保护进行规范
d、新加坡于2012年公布《个人数据保护法》,旨在防范对国内数据以及源于境外的个人资料的滥用行为
30、下面关于搜索引擎“点击模型”的描述正确的是:
a、随着数据量的积累,点击模型对搜索结果排名的预测越来越准确,它的重要性也越来越大
b、点击模型的准确性取决于数据量的大小
c、一个搜索引擎使用的时间越长,数据的积累就越充分,对于长尾搜索就做得越准确
d、当整个搜索行业都意识到点击数据的重要性后,这个市场上的竞争就从技术竞争变成了数据竞争
31、下面关于隐私泄露问题的描述,正确的是:
a、大数据时代下的隐私与传统隐私的最大区别在于隐私的数据化,即隐私主要以“个人数据”的形式出现
b、用户在使用搜索引擎时,搜索引擎可以精确地刻画出该用户的“数字肖像”
c、通过数据预测,可以预测个体“未来的隐私”
d、“数据痕迹”往往永远无法彻底消除,会被永久保留记录
32、企业数据孤岛产生的原因主要包括哪两个方面:
a、以功能为标准的部门划分导致数据孤岛
b、不同类型、不同版本的信息化管理系统导致数据孤岛
c、机构设置不合理
d、各个部门责权利不清晰
33、国外从政府信息资源开发利用到开放数据发展分为三个时期,具体包括:
a、手动开放数据阶段
b、被动开放数据阶段
c、主动开放数据阶段
d、挖掘数据价值阶段
34、交易产品的类型主要包括哪几种:
a、api
b、数据包
c、云服务
d、k8凯发的解决方案
35、关于数据治理与数据管理的关系,下面描述正确的是:
a、治理和管理是完全不同的活动
b、管理负责对管理活动进行评估、指导和监督,而治理根据治理所作的决策来具体计划、建设和运营
c、理性的治理主体通常追求治理效率
d、理性的管理主体追求经营效率
36、机器学习强调三个关键词:算法、模型、训练。
37、数据精确度校验是数据清洗的一个重要步骤。
38、pregel是一款具有代表行的查询分析计算产品。
39、“探针盒子”就是一款自动收集用户隐私的产品。
40、“啤酒与尿布”的故事,体现了“全样而非抽样”的大数据思维。
猜你喜欢
- 2023-10-22 23:34
- 2023-10-22 23:22
- 2023-10-22 23:17
- 2023-10-22 23:13
- 2023-10-22 23:10
- 2023-10-22 23:03
- 2023-10-22 22:46
- 2023-10-22 22:11
- 2023-10-22 21:43
- 2023-10-22 21:35