资源说明:使用Azure Databricks进行机器学习
易于入门的Azure Databricks中的机器学习示例集合
ML101示例笔记本: ,
高级示例笔记本: ,
Azure Databricks参考体系结构-机器学习和高级分析
主要优点:
专为企业打造,具有安全性,可靠性和可扩展性
从数据访问(ADLS,SQL DW,EventHub,Kafka等),数据准备,功能工程,在单节点或分布式中的模型构建,带有MLflow的MLop,与AzureML,Synapse和其他Azure服务集成的端到端集成。
Delta Lake将为下游ML和AI用例奠定更高数据质量,可靠性和性能的数据基础
ML运行时优化
可靠且安全地分发开源ML框架
打包并优化最常见的ML框架
内置的分布式深度学习优化
内置的AutoML和实验跟踪
使用conda的自定义环境可重现
分布式机器学习
火花MLlib
只需几行代码更改即可将单节点迁移到分布式:
分布式超参数搜索(Hyperopt,Gridsearch)
PandasUDF将模型分布在数据或超参数的不同子集上
考拉:Spark上的Pandas Da
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。