留学在线 2021-11-08 17:03:42
悉尼大学DATA3404:数据科学平台课程作业考试辅导,本研究单元全面概述了数据科学平台的内部机制以及管理大型数据收集的系统。这些技能是成功进行性能调整和了解处理大数据时面临的可伸缩性挑战所必需的。本单元以DATA2001的第二年-“数据科学-大数据和数据多样性”为基础,并相应地具有对SQL和数据分析任务的良好理解。
悉尼大学DATA3404本主题的第一部分着重于大规模数据管理的机制。它深入了解了数据管理平台的内部组件。主题包括:物理数据组织和基于磁盘的索引结构,查询处理和优化以及数据库调整。第二部分着重于分布式架构中的大数据的大规模管理。主题包括:分布式和复制数据库,信息检索,数据流处理和Web级数据处理。该单元将吸引寻求数据管理调优,基于磁盘的数据结构和算法以及信息检索入门的学生。对于那些从事软件工程师,数据工程师,数据库管理员和大数据平台专家等职业的人来说,这将是宝贵的。和信息检索。对于那些从事软件工程师,数据工程师,数据库管理员和大数据平台专家等职业的人来说,这将是宝贵的。和信息检索。对于那些从事软件工程师,数据工程师,数据库管理员和大数据平台专家等职业的人来说,这将是宝贵的。
悉尼大学DATA3404:数据科学平台课程作业考试辅导细节入学规则学习成果完成本单元后,您应该能够:
LO2 。了解不同的物理数据组织,包括数据分区和数据复制
LO3 。了解基于磁盘的索引结构,例如B树,可扩展哈希和位图索引
LO4 。了解查询处理和查询优化的原理
LO5 。了解(分布式)数据科学平台的原理。
LO6 。了解数据分片算法和数据复制协议
LO7 。制定有效的物理数据设计决策
LO8 。识别性能问题并能够有效地调整(分布式)数据处理系统的性能
2023-06-16
2023-09-15
2023-06-01
2022-11-02
2022-04-28
2023-07-27
2023-06-21
2021-10-29
2023-10-24
2023-06-26
2021-11-04
2020-12-31
2024-02-20
2020-12-30
2022-02-16
2023-07-05
2023-05-30
2023-05-12
2021-10-19
2021-12-16