開源

Databricks工程師是世界上一些最受歡迎的開源數據技術的原始創建者

參加聚會
背景圖片

我們最受歡迎的開源項目

圖標標題
Apache SparkTM值
Apache Spark是用於執行數據工程,數據科學和ML工作負載的統一引擎。

什麼是Apache Spark?→

比較Spark和Databricks→

訪問spark.apache.org→

圖標標題
三角洲湖
Delta Lake可讓您在AWS S3,ADLS,GCS和HDF等存儲係統的頂部建造湖泊建築。

了解有關三角洲湖的更多信息→

訪問delta.io→

科技談判:從三角洲湖入門→

圖標標題
MLFLOW
MLFlow管理ML生命周期,包括實驗,可重複性,部署和中央模型注冊表。

Databricks上的托管MLFLOW→

訪問mlflow.org→

技術談判:管理ML生命周期→

圖標標題
重新裝飾
REDASH使任何人都可以利用SQL探索,查詢,可視化和共享大小數據源的數據。

訪問github上的redash→

圖標標題
三角洲共享
Delta共享是行業第一個用於安全數據共享的開放協議,使與其他組織共享數據變得易於使用。

訪問三角洲共享→

Databricks支持這些其他流行的開源技術

圖標標題
TensorFlow
Databricks支持TensorFlow,這是一個用於深度學習和集群一般計算的庫

Databricks上的TensorFlow→

圖標標題
PytorchTM值
Facebook,Pytorch和Databricks的創建者已合作進行集成

Databricks上的Pytorch→

圖標標題
凱拉斯TM值
深學習API用Python編寫,在TensorFlow上運行。在Databricks運行時可用於ML。

Databricks上的Keras→

圖標標題
rstudio
使用R的開源工具用於協作數據科學的工具套件beplay娱乐ios

大數據編程→

圖標標題
Scikit-Learn
廣泛使用的Python軟件包用於機器學習,建立在Numpy,Scipy和Matplotlib之上

Databricks上的Scikit-Learn→

圖標標題
xgboost
一個分布式梯度提升庫,具有python,r和c ++等語言的綁定

Databricks上的XGBoost→

準備開始了嗎?

Baidu
map