云计算相关的机器学习知识架构

云计算将会是未来社会的基础设施,掌握云计算的技能,对个人来说提升职业发展层次,对企业来说掌握云计算核心技能,将获得极大竞争力。在云计算中机器学习是重要一环,下面和大家聊聊云计算所需的5种机器学习技能。 ...

云计算将会是未来社会的基础设施,掌握云计算的技能,对个人来说提升职业发展层次,对企业来说掌握云计算核心技能,将获得极大竞争力。在云计算中机器学习是重要一环,下面和大家聊聊云计算所需的5种机器学习技能。


1. 数据工程

如果IT专业人员想在云平台实施任何类型的人工智能策略,都需要了解数据工程。数据工程包含一系列要求数据整理和工作流开发的技能,以及一些软件架构的知识。

IT专业知识的不同领域可以分解为IT专业人员应该完成的不同任务。例如,数据整理通常涉及数据源标识、数据提取、数据质量评估、数据集成和管道开发,以在生产环境中执行这些操作。

数据工程师应该能够轻松地使用关系数据库、NoSQL数据库和对象存储系统。Python是一种流行的编程语言,可以与批处理和流处理平台(如apachebeam)和分布式计算平台(如apachespark)一起使用。即使IT人员不是精通Python程序的专家,掌握一些Python语言的知识将使其能够从大量的开源工具中获取数据工程和机器学习。

数据工程在所有主要云平台中都得到了很好的支持。AWS公司提供了全面的服务来支持数据工程,例如AWS Glue,适用于Apache Kafka的Amazon Managed Streaming(MSK)和各种Amazon Kinesis服务。AWS Glue是数据目录以及提取、转换和加载(ETL)服务,其中包括对计划作业的支持。MSK是数据工程管道的有用构建块,而Kinesis服务对于部署可扩展流处理管道特别有用。

谷歌云平台提供了Cloud Dataflow,这是一项托管的Apache Beam服务,可以支持批处理和Steam处理。对于ETL流程,谷歌云平台提供了基于Hadoop的数据集成服务。

Microsoft Azure也提供了几种托管数据工具,例如Azure Cosmos DB、Data Catalog和Data Lake Analytics等。

2. 建立模型

机器学习是一门正在不断发展和进步的学科,IT人员可以通过研究和开发机器学习算法来从事自己的职业。

IT团队使用工程师提供的数据来构建模型和创建可以提出建议,预测值和对项目进行分类的软件。重要的是要了解机器学习的基础知识,即使许多模型构建过程都是在云中自动完成的。

作为模型构建者,需要了解数据和业务目标,制定问题的解决方案,并了解如何将其与现有系统集成的工作。

市场上的一些产品包括谷歌公司的Cloud AutoML,这是可以帮助组织使用结构化数据以及图像、视频和自然语言来构建自定义模型的服务,而无需对机器学习有更多的了解。 微软Azure在Visual Studio中提供了ML.NET模型构建器,该模型构建器提供了用于构建、训练和部署模型的界面。Amazon SageMaker是另一项托管服务,用于在云中构建和部署机器学习模型。

这些工具可以选择算法,确定数据中哪些特征或属性最有用,并使用称之为超参数调整的过程优化模型。这些服务扩展了机器学习和人工智能策略的潜在用途。正如人们驾驶汽车不必成为汽车机械工程师一样,IT专业人员也不需要获得机器学习的研究生学位来构建有效的模型。

3. 公平与偏差检测

算法做出的决策直接而显著地影响个人。例如,金融服务使用人工智能来做出有关信贷的决策,这可能会无意中对特定人群产生偏见。这不仅可能有拒绝信贷对个人带来的影响,而且还会使金融机构面临违反《平等信贷机会法》等法规的风险。

这些看似艰巨的任务对于人工智能和机器学习模型是必不可少的。检测模型中的偏差可能需要具有统计和机器学习技能,但是与模型构建一样,某些繁重的工作可以由机器完成。

FairML是用于审核预测模型的开源工具,可帮助开发人员识别工作中的偏见。检测模型偏差的经验还可以为数据工程和模型构建过程提供帮助。谷歌云的公平性工具在市场上领先,其中包括假设分析工具、公平性指标和可解释的人工智能服务。

4. 模型性能评估

模型构建过程的一部分是评估机器学习模型的性能。例如,根据准确性和召回率对分类器进行评估。回归模型(例如那些预测房屋出售价格的模型)是通过测量平均误差率来评估的。

如今表现良好的模型将来可能会表现不佳。问题不在于该模型是否以某种方式被破坏,而是该模型是根据不再反映其使用环境的数据进行训练的。即使没有突然的重大事件,也会发生数据漂移。重要的是评估模型并在生产中继续对其进行监视。

Amazon SageMaker、Azure Machine Learning Studio和Google Cloud AutoML等服务包括一系列模型性能评估工具。

5. 领域知识

领域知识并不是一种特定的机器学习技能,但它是成功的机器学习策略中最重要的部分之一。

每个行业都有一定的知识体系,云计算也是,必须以某种能力进行研究,尤其对于构建算法的决策者。机器学习模型受到约束以反映用于训练它们的数据。具有领域知识的IT人员对于知道在哪里应用人工智能,并评估其有效性至关重要。5种机器学习技能就是今天 和大家分享的内容,希望对大家有所帮助。

 

 

免责声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,也不承认相关法律责任。如果您发现本社区中有涉嫌抄袭的内容,请发送邮件至:operations@xinnet.com进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

相关文章

免费咨询获取折扣